1、 未经授权引用或转发须承担法律责任及一切后果,并请务必阅读文后的免责声明 市场研究部市场研究部 2026 年年 5 月月 29 日日 看好看好 事件事件 2026 年 4-5 月,DeepSeek 将 V4-Pro API 价格降至原定价 1/4 并永久执行,成为国产大模型价格战关键转折点。小米随后跟进 MiMo-V2.5 系列 API 永久降价。核心观点核心观点 DeepSeek 本轮降价将临时优惠转为永久价格体系,改写了全球大模型 API 定价基准。其 V4-Pro 各计费项统一降价 75%,标准输入价格仅为 GPT-5.5 Pro 的约 1/72,高缓存命中场景下企业使用成本可降 90%
2、以上。降价未牺牲模型能力,Openrouter 数据显示 5 月至今 DeepSeek V4 Flash 调用量排名第一。降价核心源于底层技术架构优化,V4 系列采用混合注意力架构与多 token 预测技术,单token 推理浮点运算量仅为前代的 27%,KV 缓存大小降至前代的10%。同时,DeepSeek V4 已与华为昇腾完成深度适配,国产算力生态成熟提供了供应链支撑。Gartner 预测,到 2030 年大模型推理成本将较 2025 年降低超 90%,本次降价是这一长期趋势的阶段性体现。DeepSeek 的永久降价打破了行业原有竞争平衡,基座模型进入 K型分化时代。中间层通用模型厂商面
3、临最大压力,既无闭源前沿模型的能力护城河,又失去了性价比优势;私有化部署能力强的厂商相对受益,金融、政务等行业有刚性本地化需求;C 端/多模态产品厂商冲击有限,收入不完全依赖 API;闭源前沿模型在复杂任务上仍有护城河。高端模型市场具备独立定价能力,智谱 GLM-5.1 等厂商2026 年 Q1 涨价 83%后调用量反而增长 400%,验证高价值场景下能力优先于价格。降价将大幅刺激大模型总调用量爆发式增长,带来产业链系统性价值重分配。云厂商迎来结构性利好,AI 推理需求持续增长推高云服务价格中枢;国产 AI 软硬件生态闭环加速形成,为国产半导体产业链打开替代窗口;应用层“Token 自由”时代
4、到来,长文档分析、代码生成等场景将实现规模化运行,AI 应用从试点阶段进入全面商业化兑现期。投资线索投资线索 重点把握三大投资方向:一是优先布局 AI 应用与 Agent 赛道,具备清晰场景闭环和变现能力的厂商有望率先实现业绩兑现;二是布局国产推理算力产业链,关注国产 AI 芯片、算力租赁及基础软件企业;三是关注具备强私有化部署能力的行业模型厂商。同时需警惕缺乏核心技术壁垒的中间层通用模型厂商风险。资本市场估值逻辑已转向认可成本曲线重构能力,长期看好具备成本重构与生态协同优势的产业链核心标的。行业行业研究研究 DeepSeek 永久降价:永久降价:模型模型成本曲线重构成本曲线重构 市场表现截至
5、市场表现截至 2026.5.28 数据来源:Wind,国新证券整理 相关研究相关研究 分析师:钟哲元 登记编码:S1490523030001 邮箱: 证券研究报告证券研究报告 -10%-5%0%5%10%15%20%25%30%35%40%2025-05-292025-06-292025-07-292025-08-292025-09-292025-10-292025-11-292025-12-292026-01-292026-02-282026-03-312026-04-30801750.SI000300.SH 行业研究 未经授权引用或转发须承担法律责任及一切后果,并请务必阅读文后的免责声明
6、2 风险提示风险提示 1、技术发展不及预期;2、市场竞争加剧;3、地缘政治影响。行业研究 未经授权引用或转发须承担法律责任及一切后果,并请务必阅读文后的免责声明 2 目录目录 一、从阶段性补贴到长期价格锚的确立一、从阶段性补贴到长期价格锚的确立.3 二、工程效率突破而非短期补贴二、工程效率突破而非短期补贴.4 三、基座模型进入三、基座模型进入 K 型分化时代型分化时代.4 四、需求扩容与价值重分配四、需求扩容与价值重分配.5 五、五、投资建议投资建议.6 六、风险提示六、风险提示.6 行业研究 未经授权引用或转发须承担法律责任及一切后果,并请务必阅读文后的免责声明 3 一、一、从阶段性补贴到长