1、告超节点行业深度:核心增量环节、发展趋势、产业链影响及相关公司深度梳理超节点,即物理上由多台设备组成,逻辑上以一台机器学习、思考、推理,即通过Scale-up而获得远超Scale-out的卡间互联带宽。因此,超大规模的超节点是大模型训练最理想的工具。当前,全球大厂均已先后布局超节点产品,英伟达已展出其72卡、144卡、576卡的超节点路径,华为也亮相384卡、8192卡、15488卡的超节点方案。超节点将成为算力的主流形态,意味着在未来,算力需求方的采购,将逐渐以超节点为单位,而不是GPU卡。后续随着国产卡规模放量以及超节点渗透率持续提升,相关人士基于乐观假设测算到2028年我国超节点架构市场
2、规模有望达到3414亿元,26-28年CAGR为194%。超节点行业概况1、超节点是当前高密度AI算力的主流架构形态超节点是面向大模型训练与推理设计的新一代整机柜级一体化AI算力基础设施,它将数十到数百颗GPU/NPU在物理与逻辑层面深度紧耦合,通过自研高速互联协议、全局统一内存和整机柜级供配电与散热体系,让多机柜、上万颗芯片组成的集群在使用上如同一台巨型超级计算机,是当前高密度AI算力的主流架构形态。引入超节点是为了解决传统服务器集群在大模型训练中遇到的通信墙、功耗墙、复杂度墙三大瓶颈:传统以太网与PCIe组网时延高、带宽不足,导致万卡集群算力利用率大幅下降;高密度AI芯片功耗飙升,风冷无法
3、满足散热需求;松散堆叠的服务器部署复杂、故障点多、调度效率低,而超节点通过柜内紧耦合、原生液冷、集中供电与统一管理,大幅提升通信效率、降低能耗、简化部署,让万亿参数模型训练成为可能。(divcenter)传统集群面临的“三堵墙”问题(/divcenter)超节点的技术难点集中在高密集成、高速互联、全局协同、可靠运维四个层面。首先,单机柜上百颗芯片带来极高的供电与散热压力,需要支撑数百千瓦级集中供电与高效液冷方案。其次,柜内TB/s级带宽、百纳秒级时延的紧耦合互联,对自研协议、交换芯片、高速线缆与信号完整性要求极高。同时,全局统一内存与硬件级集合通信需要软硬件深度协同;此外,高密度、高功耗、高复
4、杂度的系统还必须解决漏液、供电冗余、故障定位与快速恢复等工程化难题,才能实现稳定商用。海外层面,英伟达于2024年率先推出GB200NVL72超节点,实现单机72卡高密度集成,依托NVLink高速互联协议实现节点内极低通信延迟与超高带宽。2025年进一步迭代升级GB300系列超节点,持续提升算力密度与集群扩展能力。凭借集中式供电散热设计与全栈CUDA生态深度协同,成为全球超节点主流标杆方案。国内层面,2024年11月腾讯联合中国信通院发布ETH-X超节点方案,单机柜支持64颗GPU,并通过以太网的RoCE协议实现机柜内互联;2025年7月华为推出AtlasA3900SuperPod,最大支持3
5、84颗昇腾910NPU与自研LQC协议,9月阿里发布磐久AL128超节点,以128-144卡高密配置、自研ALink协议实现Pb/s级带宽。2025年11月,中科曙光ScaleX640以640卡规模刷新纪录,百度天池系列覆盖32-512卡多规格并搭载自研互联协议,字节跳动大禹超节点以64-128卡配置、自研EthLink协议实现标准化部署。2026年3月,中科曙光推出ScaleX40,华为推出AtlasA3950SuperPod等超节点方案,分别以40卡无线缆架构、8192颗昇腾950NPU的万卡级规模,推动国产超节点向更高算力、更大集群全面升级。2、当前业界推出的超节点产品包含多种产品硬件形
6、态当前业界推出的超节点产品包含如下多种产品硬件形态:整机柜超节点;分机柜超节点;级联超节点。整机柜超节点:以英伟达NVL72为代表的整机柜超节点方案,采用高度集成化设计,在单一机柜内整合计算托盘、交换托盘形态的计算节点与交换节点,通过线缆托盘实现Scale-Up网络高速互联。该架构类似传统框式交换机或刀片服务器,均属于封闭硬件架构。即便厂商开放硬件设计规范,计算托盘、交换托盘、线缆托盘及机柜仍需依赖同一厂商提供,存在一定的厂商锁定风险。3、超节点的实现核心在于构建高带宽、低延迟的Scale-Up(纵向扩展)通信域超节点的实现核心在于构建高带宽、低延迟的Scale-Up(纵向扩展)通信域。英伟达