《电子行业2026年度策略深度系列一:超节点大模型的“光刻机”国产算力突围的革命性机会-251114(29页).pdf》由会员分享,可在线阅读,更多相关《电子行业2026年度策略深度系列一:超节点大模型的“光刻机”国产算力突围的革命性机会-251114(29页).pdf(29页珍藏版)》请在三个皮匠报告上搜索。
1、超节点:大模型的“光刻机”,国产算力突围的革命性机会-电子行业2026年度策略深度系列一报告摘要:1、超节点时代,同等卡数规模集群,超节点形态的集群将使得先进制程需求倍增!超节点相比于传统AI算力集群,使用了数十倍数量的Scale-upswitch芯片,其Scale-upswitch芯片数量与集群GPU数量比之相近甚至超过。而Scale-upswitch往往采用与GPU同等先进制程工艺,将消耗同等规模的先进制程产能。在以往市场对“算力需求-先进制程产能”的关系分析中,往往只关注了GPU本身的需求量对先进制程产能的带动,而忽视了switch芯片。超节点形态下,同等数量的GPU将叠加巨量的Scal
2、e-upswitch芯片,促成先进制程需求的翻倍增长。意味着,超节点时代,先进制程的增长斜率将倍增!台积电与中芯国际等具备先进工艺能力的厂商,有望充分受益。2、超节点Scale-upswitch需求大增,交换机、交换芯片较Scale-out有近40倍的需求空间。以华为Atlas950超节点(8192卡)为例,据相关公开资料,其使用了9000+颗LRS(低维交换芯片)与500+颗HRS(高维交换芯片),Scale-up交换机价值量占整个超节点价值量超过6%(东北电子团队测算)。3、中国特色的超节点机会:以规模换性能,以能源换性能。由于工艺制程限制,国产芯片单卡算力将长期落后于海外芯片,而Scal
3、e-out下系统性能受到集群规模限制,一味增加集群卡数并不能实现系统性能的持续提升,即国产算力无法通过数倍于海外集群卡数的Scale-out集群达到接近海外集群的性能。但超节点打破了规模限制,能够实现“三个臭皮匠,顶个诸葛亮”的功效。中国超节点,通过以规模换性能,以能源换性能,可以通过更多的卡数和更高的能耗实现与海外超节点同等的算力。以华为和英伟达相关对标超节点产品做比较,在同等算力条件下,2025年,国产超节点卡数规模是海外超节点的3.2倍,而到2027年,该比值将提升至8.5倍;同等算力下,国产超节点的能耗是海外超节点的23倍。中国超节点各环节中,与量有关的环节,如GPU、交换芯片、先进制
4、程等,将呈现比海外算力更高的增长潜能;与能源有关系的环节,如电源、液冷,将较海外算力有更陡峭的增长斜率。4、国内超节点,未来几年将以柜内全铜、柜间全光的连接方案为主流。无论是华为昇腾超节点还是阿里磐久超节点,其未来一两代架构均采用柜内全铜、柜间全光的连接方案,我们认为是国内芯片工艺制程相对落后,对正交背板和CPO的诉求不强。在EUV光刻机突破前,国产超节点可能持续采用该方案。因此,在连接环节的选择上,我们认为:国内看铜,海外看光&PCB。我们认为,超节点就是大模型的“光刻机”。从重要性看,大模型的训练和推理离不开高算力、高性能的超节点基础设施,正如先进制程离不开高性能光刻机。从价值量看,一台1
5、980iDUV/低数值孔径EUV光刻机售价约1亿美金,而上万卡规模的超节点售价预计也将超过1亿美金。超节点将是中国算力突围的一次革命性机会,在国产算力拥有万卡规模等级的超节点后(如26H2,华为Atlas950),国产大模型将真正拥有了训练利器,有望极大提升国产大模型训练效率。我们看好在明年国产大模型与中国AI资本开支双双爆发,国产算力开启繁荣增长。优于大势风险提示:晶圆厂扩产不及预期、国内AI资本开支不及预期1.单卡时代落幕,全球主流算力竞逐超节点.1.单卡时代落幕,全球主流算力竞逐超节点1.1.Scale-up突破大模型训练瓶颈,超大规模超节点将成趋势大模型参数规模持续扩张,分布式训练成为
6、必然选择。随着Transformer架构的广泛应用,模型参数量呈指数级增长,对算力、内存与通信带宽的需求迅速攀升。单颗GPU在计算与存储维度均已无法独立支撑超大规模模型训练,多GPU并行的分布式架构成为唯一可行路径。分布式训练对通信系统提出前所未有的挑战。与传统数据中心以请求响应为主的零散通信不同,大模型训练依托于特定的分布式训练算法(如数据并行、张量并行、流水线并行等),形成高强度、周期性且同步性极高的“集合通信”负载。这类通信在带宽与时延维度均处于极限状态,成为系统扩展性的关键瓶颈。为了协同数千乃至上万颗GPU,训练过程必须依赖几类对通信带宽和延迟极其敏感的运算:All-Reduce(全归