报告预览

计算机行业重大事项点评：Token推理大爆发国产算力再迎海量需求-260302（4页）.pdf

编号：1147358

PDF DOCX 4页 775.36KB 下载积分：VIP专享

下载报告请您先登录！

计算机行业重大事项点评：Token推理大爆发国产算力再迎海量需求-260302（4页）.pdf

1、证券研究报证券研究报告告证监会审核华创证券投资咨询业务资格批文号：证监许可（2009）1210 号未经许可，禁止转载未经许可，禁止转载行业研究行业研究计算机计算机 2026 年年 03 月月 02 日日计算机行业重大事项点评推荐推荐（维持）（维持）Token 推理大爆发，国产算力再迎海量需求推理大爆发，国产算力再迎海量需求事项：事项：2026 年 2 月 9 日至 15 日，OpenRouter 数据显示，中国模型以 4.12 万亿 Token的调用量，首次超过同期美国模型的 2.94 万亿 Token。2 月 16 日至 22 日，平台调用量排名前五的模型中

2、，有四款来自中国厂商，分别为 MiniMax 的 M2.5、月之暗面的 Kimi K2.5、智谱的 GLM-5 以及 DeepSeek 的 V3.2。这四款模型合计贡献了 Top5 总调用量的 85.7%。评论：评论：需求端：算力芯片进入高负载常态化阶段。需求端：算力芯片进入高负载常态化阶段。Token 消耗量的指数级攀升，表面看是用户规模与使用时长的增长，但其背后更深层次的驱动力，是用户对 AI使用模式的根本性转变。AI 的角色正在从一个提供简单信息、进行日常闲聊的“问答工具”，进化为能够深度参与工作流、处理复杂任务的“生产力工具”。英伟达 CEO 黄仁勋指出，没有算力，就无法生成 Toke

3、n；没有 Token，就无法带来收入增长。算力需求的持续扩张正直接拉动算力芯片需求增长，中国 GPU产业进入高景气放量阶段，弗若斯特沙利文预测，中国 AI 计算加速芯片市场规模将从 2024 年的 1,425.37 亿元增至 2029 年的 13,367.92 亿元，年均复合增长率为 53.7%。从细分市场上看，GPU 的市场增长速度最快，其市场份额预计将从 2024 年的 69.9%进一步提升至 2029 年的 77.3%，市场规模达到 10,333.40亿元。整体来看，推理负载常态化意味着算力需求从“周期性训练投入”转向“持续性推理消耗”，算力芯片产业价值中枢呈现系统性上移趋势。供给端：海

4、外约束强化与国产替代能力增强供给端：海外约束强化与国产替代能力增强 1）海外供应紧张：政策限制叠加产能瓶颈，供给弹性持续受限。）海外供应紧张：政策限制叠加产能瓶颈，供给弹性持续受限。据环球网援引彭博社 2 月 24 日报道，美国商务部表示，自批准对华出口 AI 芯片两个月以来，英伟达仍尚未向中国售出任何 H200 芯片。今年 1 月，美国商务部虽发布新规放宽 H200 芯片对华出口限制，但美国国务院坚持推动更严格的出口限制。多重不确定性之下，中国客户在许可条件不明朗前未向英伟达下达订单。在政策扰动之外，全球算力硬件本身亦处于结构性紧平衡状态，目前数据中心GPU 的交付周期目前为 36 至 52

5、周。综合来看，短期供给弹性难以有效释放，交付周期拉长成为常态，海外算力供给缺口或将持续存在，为国产算力替代与本土供应链加速完善创造窗口期。2）国产芯片替代能力增强：性能与商业化同步跃迁。）国产芯片替代能力增强：性能与商业化同步跃迁。Token 消耗量持续增长本质反映大模型推理调用频次与负载强度同步提升，而 FP8 指标成为下一代算力标准，本质是通过一定精度牺牲，获得更大算力综合性能。2 月 12 日，摩尔线程首度公开 S5000 单卡 FP8 算力突破 1000TFLOPS，训练精度紧咬英伟达 H100，差距不到 1%。2026 一季度，华为预计发布昇腾 950PR，算力同样达到 1PFLO

6、PS（FP8）。国产芯片积极推进生态适配，自 2025 年 12 月至2026 年 3 月，沐曦股份 C500/C550 已逐步适配腾讯混元图像 3.0、阶跃星辰Step3.5flash、智谱 GLM-5 等多家国产大模型。随着模型适配能力持续完善，国产 GPU 正由技术可用迈向规模可用，2 月 27 日，寒武纪、摩尔线程与沐曦股份相继发布 2025 年度业绩快报，三家企业均实现了三位数的营业收入增长，其中寒武纪首度实现年度扭亏为盈。整体来看，国产 GPU 在算力密度、生态适配与商业兑现三个维度同步突破，国产算力芯片正逐步实现规模化替代。我们认为：在推理负载常态化与海外高端算力供给受限背景下，

友情提示

1、下载报告失败解决办法
2、PDF文件下载后，可能会被浏览器默认打开，此种情况可以点击浏览器菜单，保存网页到桌面，就可以正常下载了。
3、本站不支持迅雷下载，请使用电脑自带的IE浏览器，或者360浏览器、谷歌浏览器下载即可。
4、本站报告下载后的文档和图纸-无水印,预览文档经过压缩，下载后原文更清晰。

本文（计算机行业重大事项点评：Token推理大爆发国产算力再迎海量需求-260302（4页）.pdf）为本站（鲁大师）主动上传，三个皮匠报告文库仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对上载内容本身不做任何修改或编辑。若此文所含内容侵犯了您的版权或隐私，请立即通知三个皮匠报告文库（点击联系客服），我们立即给予删除！

温馨提示：如果因为网速或其他原因下载失败请重新下载，重复下载不扣分。