当前位置:首页 > 报告详情

字节跳动:2025年GPU Scale-up 互联技术白皮书(24页).pdf

上传人: 孔明 编号:646188 2025-04-30 24页 4.97MB

下载:
word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了字节跳动自研的下一代Scale-up网络方案EthLink。EthLink基于以太网技术,为AI集群提供低延迟、高带宽的互联网络,满足AI应用对GPU之间高速互联传输的需求。文章首先分析了GPU架构和互联方案,指出当前GPU主要通过Load/Store操作在Scale-up网络实现大块数据的传输,但会消耗计算引擎的算力资源。然后提出了下一代Scale-up网络的需求,包括支持Load/Store语义、RDMA语义、简化RDMA接口、优化Cache Coherency等。接着介绍了EthLink网络方案,包括EthLink协议栈、网络拓扑和网络接口。EthLink协议栈支持GPU的Load/Store和RDMA操作,网络拓扑采用多协议栈和端口负载均衡,网络接口通过优化报文封装和链路层可靠传输来提升效率。总的来说,EthLink通过优化以太网技术,为AI集群提供了高效、可靠的Scale-up网络互联方案。
GPU架构如何支持Load-Store语义? EthLink网络方案如何优化GPU集群互联? EthLink如何实现低延迟和高带宽的GPU集群互联?
客服
商务合作
小程序
服务号
折叠