1、 证 券 研 究 报证 券 研 究 报 告告 证监会审核华创证券投资咨询业务资格批文号:证监许可(2009)1210 号 未经许可,禁止转载未经许可,禁止转载 行业研究行业研究 计算机计算机 2026 年年 03 月月 02 日日 计算机行业重大事项点评 推荐推荐(维持)(维持)Token 推理大爆发,国产算力再迎海量需求推理大爆发,国产算力再迎海量需求 事项:事项:2026 年 2 月 9 日至 15 日,OpenRouter 数据显示,中国模型以 4.12 万亿 Token的调用量,首次超过同期美国模型的 2.94 万亿 Token。2 月 16 日至 22 日,平台调用量排名前五的模型中
2、,有四款来自中国厂商,分别为 MiniMax 的 M2.5、月之暗面的 Kimi K2.5、智谱的 GLM-5 以及 DeepSeek 的 V3.2。这四款模型合计贡献了 Top5 总调用量的 85.7%。评论:评论:需求端:算力芯片进入高负载常态化阶段。需求端:算力芯片进入高负载常态化阶段。Token 消耗量的指数级攀升,表面看是用户规模与使用时长的增长,但其背后更深层次的驱动力,是用户对 AI使用模式的根本性转变。AI 的角色正在从一个提供简单信息、进行日常闲聊的“问答工具”,进化为能够深度参与工作流、处理复杂任务的“生产力工具”。英伟达 CEO 黄仁勋指出,没有算力,就无法生成 Toke
3、n;没有 Token,就无法带来收入增长。算力需求的持续扩张正直接拉动算力芯片需求增长,中国 GPU产业进入高景气放量阶段,弗若斯特沙利文预测,中国 AI 计算加速芯片市场规模将从 2024 年的 1,425.37 亿元增至 2029 年的 13,367.92 亿元,年均复合增长率为 53.7%。从细分市场上看,GPU 的市场增长速度最快,其市场份额预计将从 2024 年的 69.9%进一步提升至 2029 年的 77.3%,市场规模达到 10,333.40亿元。整体来看,推理负载常态化意味着算力需求从“周期性训练投入”转向“持续性推理消耗”,算力芯片产业价值中枢呈现系统性上移趋势。供给端:海
4、外约束强化与国产替代能力增强供给端:海外约束强化与国产替代能力增强 1)海外供应紧张:政策限制叠加产能瓶颈,供给弹性持续受限。)海外供应紧张:政策限制叠加产能瓶颈,供给弹性持续受限。据环球网援引彭博社 2 月 24 日报道,美国商务部表示,自批准对华出口 AI 芯片两个月以来,英伟达仍尚未向中国售出任何 H200 芯片。今年 1 月,美国商务部虽发布新规放宽 H200 芯片对华出口限制,但美国国务院坚持推动更严格的出口限制。多重不确定性之下,中国客户在许可条件不明朗前未向英伟达下达订单。在政策扰动之外,全球算力硬件本身亦处于结构性紧平衡状态,目前数据中心GPU 的交付周期目前为 36 至 52
5、 周。综合来看,短期供给弹性难以有效释放,交付周期拉长成为常态,海外算力供给缺口或将持续存在,为国产算力替代与本土供应链加速完善创造窗口期。2)国产芯片替代能力增强:性能与商业化同步跃迁。)国产芯片替代能力增强:性能与商业化同步跃迁。Token 消耗量持续增长本质反映大模型推理调用频次与负载强度同步提升,而 FP8 指标成为下一代算力标准,本质是通过一定精度牺牲,获得更大算力综合性能。2 月 12 日,摩尔线程首度公开 S5000 单卡 FP8 算力突破 1000TFLOPS,训练精度紧咬英伟达 H100,差距不到 1%。2026 一季度,华为预计发布昇腾 950PR,算力同样达到 1PFLO
6、PS(FP8)。国产芯片积极推进生态适配,自 2025 年 12 月至2026 年 3 月,沐曦股份 C500/C550 已逐步适配腾讯混元图像 3.0、阶跃星辰Step3.5flash、智谱 GLM-5 等多家国产大模型。随着模型适配能力持续完善,国产 GPU 正由技术可用迈向规模可用,2 月 27 日,寒武纪、摩尔线程与沐曦股份相继发布 2025 年度业绩快报,三家企业均实现了三位数的营业收入增长,其中寒武纪首度实现年度扭亏为盈。整体来看,国产 GPU 在算力密度、生态适配与商业兑现三个维度同步突破,国产算力芯片正逐步实现规模化替代。我们认为:在推理负载常态化与海外高端算力供给受限背景下,