1、超节点:26年国产算力破局之道华泰研究作为算力集群化提效的核心手段,超节点突破物理系统边界,在单机柜内实现数十至数百张加速卡紧耦合互联。我们看好26年起国产超节点在AI训推驱动下开启放量:1)万亿参数模型倒逼算力集群化提效,超节点通过系统级重构降低通信开销,有效将理论算力转化为可用吞吐;2)基于国产卡与海外先进卡的差距,超节点或为国产算力的破局之道,通过放大集群内系统级互联的作用以弥补单卡差距;3)自25年起,国内各大算力参与方陆续发布超节点样机。我们测算28年国产超节点市场空间有望达到3414亿元,26-28年CAGR为194%,建议关注超节点核心增量Scaleup环节(交换芯片、交换机和铜
2、连接)以及整机柜、液冷、光模块等其他受益环节。优势:底层三大特征构筑壁垒,相比传统节点有切实的训推效率提升我们认为,超节点相对传统计算节点具备三大核心优势:1)高带宽:专属协议(如NVLink6.0)实现双向3.6TB/s的极速互联,领先传统协议(如PCle6.0)十数倍;2)低时延:跨节点网络降维至机柜内总线直连,单跳时延实现微秒至纳秒级跨越;3)内存语义通信:摒弃传统网络报文寻址,GPU间可直接跨板卡读取物理内存,大幅提升节点间通信效率。从实际效果来看,根据MLPerf体系中英伟达GB200超节点实测推演,在剔除单卡算力代差后,超节点系统相较传统节点在训练环节能够基本保全性能表现(0.97
3、1.11x),而在推理环节则能实现1.231.50x的大幅效率增益。空间:超节点千亿级空间可期,核心增量为Scaleup环节随着国产卡规模放量以及超节点渗透率持续提升,我们测算到2028年我国超节点架构市场规模有望达到3414亿元,26-28年CAGR为194%。我们认为超节点最核心的增量在于支撑超大规模节点内部高效互联的Scaleup环节,具体包括交换芯片、交换机和铜连接。从空间来看,我们预计:1)2028年国内Scaleup交换芯片市场规模有望达到172亿元,26-28ECAGR为231%;2)2028年国内超节点SwitchTray市场空间有望达到277亿元,26-28ECAGR为204
4、%;3)2029年我国AI高速铜连接(包括超节点和普通节点)市场规模有望达到309亿元,25-29ECAGR达46%。与市场不同的观点市场担忧海外先进卡(如H200)若进入会导致国产超节点需求大幅减少,而我们认为虽确实会有一定的此消彼长,但长期来看国产超节点或为大趋势,CSP厂商同时应用海外先进卡和国产超节点并不冲突:1)海外卡本身供应有限,仅能满足部分CSP的AI算力需求;2)海外卡如H200适合用作AI训练,CSP厂商仍可通过国产卡超节点来进行推理(根据我们的研究,英伟达GB200NVL72的测试结果反映超节点对于推理的增益更大)。核心观点我们判断2026年为国产超节点元年,超节点起量或将
5、首要带动Scaleup环节公司利润增长,其他算力链也将渐次受益。产业链公司包括:交换芯片:盛科通信、中兴通讯等;交换机:锐捷网络、星网锐捷、紫光股份、华勤技术、菲菱科思;铜连接:华丰科技、意华股份、立讯精密、瑞可达。整机柜:华勤技术、浪潮信息、紫光股份、中兴通讯等;液冷:英维克、申菱环境、飞荣达;光模块:华工科技、光迅科技等;AIDC:润泽科技、奥飞数据等。风险提示:云厂商资本开支投入不及预期;超节点方案落地进程不及预期;本研报中涉及到未上市公司或未覆盖个股内容,均系对其客观公开信息的整理,并不代表本研究团队对该公司、该股票的推荐或覆盖。超节点:算力集群化提效手段,26年有望成为放量元年.超节
6、点:算力集群化提效手段,26年有望成为放量元年核心问题1:超节点是什么?超节点是借助高速低时延互联等技术,突破传统“单机服务器-跨服务器集群”的系统边界,在单一物理系统(通常指单机柜或等效的系统域)内实现数十乃至数百张加速卡紧耦合互联的计算单元。在大模型应用的拉动下,传统数据中心的横向拓展范式暴露出跨机通信的瓶颈(如大模型分布式训练中,其高频次的AIl-Reduce等集合通信操作,使得跨服务器的带宽、时延成为了根本瓶颈),以“超节点”为代表的“集成计算单元”形式开始涌现。超节点并非直接提升算力,其本质原理是在不改变单卡计算能力的前提下,通过系统级重构,弱化计算、存储与网络之间的层级割裂,使多卡