计算机行业周报：DeepSeek V4模型详细解读-260427-三个皮匠报告

1、本报告版权属于国投证券股份有限公司，各项声明请参见报告尾页。1 20262026 年年 0404 月月 2727 日日计算机计算机行业周报行业周报 DeepSeek V4DeepSeek V4 模型详细解读模型详细解读证券研究报告证券研究报告投资评级投资评级领先大市领先大市-A A 维持维持评级评级首选股票首选股票目标价（元）目标价（元）评级评级行业表现行业表现资料来源：Wind 资讯升幅升幅%1M1M 3M3M 12M12M 相对收益相对收益 0.5-12.1 3.1 绝对收益绝对收益 7.1-10.6 29.1 赵阳赵阳分析师分析师 SAC 执业证书编号：S1450

2、522040001 杨楠杨楠分析师分析师 SAC 执业证书编号：S1450522060001 夏瀛韬夏瀛韬分析师分析师 SAC 执业证书编号：S1450521120006 相关报告相关报告英伟达Ising量子AI模型解读 2026-04-20 800V HVDC 开始量产，SST产业进展提速 2026-04-13 拥抱“光”，电子测量仪器板块迎来戴维斯双击 2026-04-07 算电协同为 AI 和能源数智化注入攻守兼备增长极 2026-03-22 国产 Claw 类产品应用大盘点 2026-03-15 DeepSeek V4DeepSeek V4 发布，性能比肩顶尖闭源模型发布，性能比

3、肩顶尖闭源模型 4 月 24 日，DeepSeek 公司的全新系列模型 DeepSeek-V4 的预览版本正式上线并同步开源。DeepSeek-V4 拥有百万字超长上下文，在 Agent 能力、世界知识和推理性能上均实现国内与开源领域的领先。DeepSeek-V4-Pro 拥有 1.6T 的参数量以及 49B 的激活参数，预训练数据量 33T，上下文长度 1M；DeepSeek-V4-Flash 版本拥有 284B 总参数量以及 13B 激活参数，32T 预训练数据，同样 1M 的上下文。从模型性能测试来看，从模型性能测试来看，DeepSeekDeepSeek-V4V4-ProPro 性能比肩

4、顶级闭源模型性能比肩顶级闭源模型。1）Agent Agent 能力大幅提高：能力大幅提高：在 Agentic Coding 评测中，V4-Pro 已达到当前开源模型最佳水平，并在其他 Agent 相关评测中同样表现优异。目前 DeepSeek-V4 已成为公司内部员工使用的 Agentic Coding 模型，据评测反馈使用体验优于 Sonnet 4.5，交付质量接近 Opus 4.6 非思考模式，但仍与 Opus 4.6 思考模式存在一定差距。2 2）丰富的）丰富的世界知识：世界知识：DeepSeek-V4-Pro 在世界知识测评中，大幅领先其他开源模型，仅稍逊于顶尖闭源模型 Gemini-

5、Pro-3.1；3 3）世界顶级推理性）世界顶级推理性能：能：在数学、STEM、竞赛型代码的测评中，DeepSeek-V4-Pro 超越当前所有已公开评测的开源模型，比肩世界顶级闭源模型。预训练三大更新，后训练引入预训练三大更新，后训练引入 OPDOPD，全面拥抱国产算力全面拥抱国产算力模型训练：模型训练：预训练阶段实现三预训练阶段实现三大大更新：更新：mHC 实现流形约束的残差连接;混合注意力机制（CSA+HCA）进一步压缩 KV 矩阵，实现超长上下文训练;采用 Muon 优化器，实现更快的收敛速度和更强的稳定性。后训练后训练阶段阶段采用 OPD（On-Policy Distillatio

6、n，同策略知识蒸馏）实现专家模型的融合。模型基建：模型基建：采用国产的采用国产的 TileLangTileLang 实现算子开发。实现算子开发。V4 的算子开发从 CUDA/Triton 切到了北大开源的 TileLang。DeepSeek V4 通过采用TileLang 语言做算子开发，实现了 Host（CPU）开销降低、数值精度与 CUDA 比特级一致、全面适配国产芯片平台等能力的提升。华为华为昇腾超节点系列产品全面支持昇腾超节点系列产品全面支持。根据华为官方公众号的披露，昇腾一直同步支持 DeepSeek 系列模型，本次通过双方芯模技术紧密协同，实现昇腾超节点全系列产品支持 DeepSe

计算机行业周报：DeepSeek V4模型详细解读-260427（10页）.pdf

相关报告