1、LUXSHARE TECH Proprietary and Confidential 立讯技术机密信息立讯技术机密信息 All Rights Reserved 版权所有版权所有 复制必究复制必究AI光互联发展技术发展趋势立讯技术:彭小伟2023-12-82L LUXSHARE UXSHARE TECHTECH ProprietaryProprietary andand Confidential Confidential 立讯技术机密信息 All Rights ReservedAll Rights Reserved 版权所有 复制必究目录目录人工智能计算特点及光互联要求人工智能计算特点及光互联要
2、求英伟达英伟达AI互联网络架构互联网络架构AI互联光产互联光产品技术趋势品技术趋势总结总结3L LUXSHARE UXSHARE TECHTECH ProprietaryProprietary andand Confidential Confidential 立讯技术机密信息 All Rights ReservedAll Rights Reserved 版权所有 复制必究AI人工智能计算特点GPU/CPU内核结构pAI训练数据量巨大GPT3.5:1750亿训练参量,340T bit数据量pGPU服务器用于AI训练优势主要特点主要特点GPUCPU架构核心内核简单且众多,尽管只会简单的运算,却能并
3、行处理大量数据。内核强大而复杂,专为处理一项任务,这就像一个博学的教授并行性数量庞大的内核,它能并行处理更多的任务更少内核,处理能力比CPU差100倍。内存架构配备专门的高带宽内存更注重高效的缓存数据访问,对带宽的需求较低。应用方向处理大量可预测且相似的运算,如深度学习需要快速响应的任务,如操作系统4L LUXSHARE UXSHARE TECHTECH ProprietaryProprietary andand Confidential Confidential 立讯技术机密信息 All Rights ReservedAll Rights Reserved 版权所有 复制必究算力时代AI集群
4、对光互联的要求p传输速率快速增加传输速率快速增加GPT3.5/4.0/5.0快速升级,带来训练参量的快速增加GPU不断迭代,带宽增加,推动光模块速率提升NVIDA下一代B100,即将采用1.6Tp延时要求更为严苛延时要求更为严苛并行计算,以时延最大的计算结果为准推动LPO,NPO,CPO等产品不断发展p可靠性可靠性要要求求更高更高非实时保存,任何一数据出错,所有计算重来比电信网络和传统数据中心网络要求更高推动AI互联产品向高可靠性设计p胖树胖树(Fat-Tree)结构带来更多光模块需求结构带来更多光模块需求带宽无收敛,上行带宽和下行带宽相等带来光模块数量快速增加5L LUXSHARE UXSH
5、ARE TECHTECH ProprietaryProprietary andand Confidential Confidential 立讯技术机密信息 All Rights ReservedAll Rights Reserved 版权所有 复制必究人工智能帶來人工智能帶來光光互联互联新的新的成长动能成长动能:光模块的数量相对GPU數量呈倍数增长GPU与光模块的数量关系分析SU(扩展单元)=20 node(GPU server)=20 x8 GPUsSuper POD(超级传送点)=7 SUAI Cluster System(AI集群系统)=2 4 Super POD一个基本AI集群系統使用
6、的光模块10K(基于全光架构)H100/GPU:400G&800G Optical Transceiver 1:32024Q1即将发布的H20特供版,带宽增加到900GB/s晟腾910B单卡算力0.6P,支持20003000张卡GPUH100H800H20算力2P2P0.148P带宽600GB/s400GB/s900GB/s最大集群5万2万2万用途GPT 5GPT 4GPT 3.56L LUXSHARE UXSHARE TECHTECH ProprietaryProprietary andand Confidential Confidential 立讯技术机密信息 All Rights Res