当前位置:首页 > 报告详情

HC2022.KAIST.SeongminHong.v01.pdf

上传人: 2*** 编号:136918 2023-08-03 14页 1.98MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文介绍了一种用于加速基于Transformer的文本生成任务的 多FPGA设备,名为DFX。DFX通过模型并行ism、支持GPT端到端操作的计算核心、优化的瓦片方案和轻量级路由器,实现了对Transformer模型的加速。实验结果表明,DFX相比于传统的多GPU设备,在性能和能效上都有显著的优势,平均速度提高了3.20倍,5.58倍,并且性能随着FPGA数量的增加而线性增加。
"DFX如何提高文本生成效率?" "FPGA在文本生成中的应用有哪些优势?" "DFX与多GPU appliance相比有哪些显著改进?"
客服
商务合作
小程序
服务号
折叠