当前位置:首页 > 报告详情

HC2022.KAIST.SeongminHong.v03.pdf

上传人: 2*** 编号:136919 2023-08-03 17页 1.87MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文介绍了一种名为DFX的多FPGA加速器,用于加速基于Transformer的文本生成。DFX采用模型并行主义,有效地处理大规模语言模型。Xilinx Alveo U280数据中心加速器卡提供了高性能和低成本。FPGA之间的通信通过100 Gb/s的QSFP电缆实现。DFX架构包括多FPGA加速器、计算核心和支持GPT端到端操作的FPGA集群。与GPU相比,DFX在推理延迟和吞吐量方面取得了显著的性能提升,同时具有更好的能效和成本效益。未来,研究团队将把模型扩展到GPT-3,并在数据中心进行部署。
"DFX如何实现低延迟的文本生成加速?" "如何通过DFX实现大规模语言模型的并行处理?" "DFX与GPU相比,在性能和成本效益上有哪些优势?"
客服
商务合作
小程序
服务号
折叠