《先进计算产业发展联盟:2026超大规模智算中心技术综述报告(39页).pdf》由会员分享,可在线阅读,更多相关《先进计算产业发展联盟:2026超大规模智算中心技术综述报告(39页).pdf(39页珍藏版)》请在三个皮匠报告上搜索。
1、超大规模智算中心技术综述开放计算生态GW级AIDCMW级整机柜800V HVDC两相液冷报告人单位/Report By先进计算发展产业联盟智能计算工作组 叶毓睿时间 地点/When&Where2026年5月22日北京GW-Scale Open AIDC(吉瓦级开放智算中心)研究报告0000目录Table of Contents0101时代背景AI浪潮与GW时代的到来0202GW级AIDC核心挑战Five Walls of Scale0303OCP开放系统蓝图Open Systems for AI v1.00404供电革命:800V HVDC兆瓦级机柜的能源新基建0505散热革命:液冷与两相MW
2、级整机柜的热管理0606网络革命:Scale-UpPCIe/ESUN/SUE-T/UALink与超节点0707Open Rack Wide与系统设计ORW/MGX/Catalina/Mt Diablo0808全球GW级AIDC实践NVIDIA/Meta/Microsoft/AMD0909中国GW级AIDC路径开放生态1010演进趋势与展望Roadmap与系统化思维超大规模智算中心技术综述信通院先进计算发展联盟 智能计算工作组2/292/29P A R T 0 1P A R T 0 1时代背景The Era of Gigawatt AIAI已不再是单一GPU或单台服务器的优化课题。模型参数从亿级
3、到万亿级,数据中心规模从MW走向GW,这是一场从芯片、机柜、系统到设施的全栈结构性变革。1.11.1算力需求的指数级爆炸AI模型参数与训练算力(FLOPs)在过去6年增长超过 5个数量级$1T$1TNVIDIA Blackwell+Rubin 2027前订单GTC 2026:较一年前预测翻倍1010 训练集群规模十年间扩张1万卡10万卡百万卡时代1.7GW1.7GWNCP累计部署(1M+GPUs)较2025年GTC的550MW翻3倍46%46%中国智能算力CAGR(23-28)占全球29%(仅次于美国34%)AI训练算力需求增长(FLOPs,20182028E)1101001000100001
4、000001000000100000002018202020222024202520262027E2028E单机柜功率密度演进(kW/rack)10501326001,0001,8000500100015002000传统IDCHopper世代BlackwellGB200RubinNVL144KyberRubin UltraFeynman 2028超大规模智算中心技术综述信通院先进计算发展联盟 智能计算工作组4/294/291.21.2智算中心(AIDC)的三阶段演进从“GPU服务器堆叠”到“整机柜系统”再到“GW级AI Factory”P H A S E 1P H A S E 1Phase 1
5、 服务器即计算机Server-Centric时间20122012 20222022规模kW级机柜 千卡集群 以单台GPU服务器为原子单元 风冷为主,PUE 1.41.6 InfiniBand横向Scale-Out为主 训练以CV/NLP传统模型为主P H A S E 2P H A S E 2Phase 2 整机柜即计算机Rack-Scale时间20232023 20262026规模MW级机柜 万十万卡集群 GB200/Rubin NVL72/144整机柜 液冷+800VDC成为新标配 NVLink纵向Scale-Up成为关键瓶颈 MoE/万亿参数大模型驱动P H A S E 3P H A S
6、E 3Phase 3 智算中心即计算机Gigawatt AI Factory时间20262026 20302030规模GW级园区 百万卡集群 Vera Rubin DSX参考架构落地 跨园区AI Super-Factory Scale-Across Agentic AI/推理时代(Token经济)电网协同/源网荷储一体化超大规模智算中心技术综述信通院先进计算发展联盟 智能计算工作组5/295/29P A R T 0 2P A R T 0 2GW级AIDC的核心挑战Five Walls of Scale当训练集群从万卡走向百万卡、数据中心从MW走向GW,传统数据中心的每一根技术支柱都将被推向物理