1、 免责声明和披露以及分析师声明是报告的一部分,请务必一起阅读。1 证券研究报告 科技科技 2026 年中期策略会速递年中期策略会速递 算力集群走向异构,算力集群走向异构,Token 工厂崛起工厂崛起 华泰研究华泰研究 科技科技 增持增持 (维持维持)计算机计算机 增持增持 (维持维持)郭雅丽郭雅丽 研究员 SAC No.S0570515060003 SFC No.BQB164 +(86)21 3847 6016 王浩天王浩天*联系人 SAC No.S0570125010006 +(86)21 2897 2228 行业走势图行业走势图 资料来源:Wind,华泰研究 2026 年 5 月 31 日
2、中国内地 专题研究专题研究 5 月 27-28 日我们组织了 2026 年中期策略会,会上围绕大模型技术演进、算力供需结构、异构芯片体系以及 Token 工厂商业化路径等方向展开交流。我们看到:1)Agent 时代,ROI 开始清晰化并驱动商业化加速;2)算力产业从短期供需错配走向全链条长协锁定式短缺;3)算力架构进入重构周期,GPU 中心化体系逐步被多架构异构体系替代;4)Token 工厂与推理云成为连接模型能力与产业应用的核心基础设施层,并开始重塑软件商业模式。我们认为,AI 产业正在从“模型能力驱动阶段”进入“算力组织与效率驱动阶段”,我们看好CPU、近存计算的异构计算新需求,同时看好具
3、备独特壁垒的应用厂商向 Token 工厂转型。核心亮点:核心亮点:1、Agent 时代时代,ROI 开始清晰化并驱动商业化加速。开始清晰化并驱动商业化加速。Agent 时代,ROI 开始变得可度量与可闭环,Token 消耗与业务价值之间的映射关系逐步清晰。海外头部大模型厂商 ARR 快速增长,收入进入非线性扩张阶段,根据 The Wall Street Journal 数据,Anthropic 预计二季度收入将环比增长 130%至109 亿美元,将实现约 5.6 亿美元经营利润,盈利时间点快于预期。我们认为,伴随模型能力快速迭代,Agent 推动 ROI 显性化,模型厂商商业化进程有望持续加速
4、。2、算力产业正在从阶段性供需错配驱动的短缺,走向由长协机、算力产业正在从阶段性供需错配驱动的短缺,走向由长协机制主导的“全制主导的“全链条锁定式短缺”。链条锁定式短缺”。其本质变化在于需求侧与供给侧同时发生结构性强化,一方面国内互联网大厂资本开支持续上修;另一方面,算力产业长协机制正在全面展开,从模型厂商到云厂商再到基础设施供应商逐级锁定算力资源,显著提升了上游算力、网络、存储与云环节的收入可见性,上游资产逐步由周期属性向成长属性切换,未来增长的确定性显著提升。3、算力结构重构:从、算力结构重构:从 GPU 中心化走向多架构异构体系中心化走向多架构异构体系。我们看到,GPU中心化体系逐步走向
5、多架构异构体系,推理侧对延迟、吞吐与单位 Token成本提出更高要求,使得单一架构难以覆盖全部场景。在这一背景下,算力体系正在形成分工明确的异构结构,其中 GPU 仍承担通用计算与 Attention类动态任务,而 ASIC 以及 LPU 等专用架构则更多承担 FFN 等高确定性计算任务,以提升局部计算效率。同时,CPU 在推理链路中的重要性持续提升,在调度、内存访问与系统协同层面承担更关键作用,新型架构与异构协同体系正在加速形成。我们认为,算力产业的核心竞争逻辑正在从单点芯片性能优化转向系统级架构效率优化,推理侧成为多架构创新的核心战场。4、Token 工厂:算力产业从“资工厂:算力产业从“
6、资源供给”走向“效率竞争”的核心载体源供给”走向“效率竞争”的核心载体。Token 工厂本质是将底层算力资源转化为可规模化交付的 Token 生产能力,并通过推理云实现系统级调度与效率优化。在这一体系中,Token 不再只是计费单位,而逐步成为新的基础生产单元。具有行业壁垒的 AI 应用厂商正在加速向 AI Factory 模式转型,其核心变化在于将业务流程深度嵌入模型调用与工具链体系之中,生产具备行业语义、决策约束与 ROI 绑定属性的差异化 Token,从而实现商业模式从软件订阅向结果计费的系统性跃迁。推理云与 Token 工厂的出现,使得模型能力第一次真正以工业化生产方式进入企业级业务系