1、请务必阅读正文之后的免责声明及其项下所有内容证券研究报告证券研究报告|20262026年年0404月月2626日日优于大市优于大市1DeepSeekDeepSeek V4V4 发布点评发布点评百万上下文进入普惠时代,国产算力成功适配需求爆发将至百万上下文进入普惠时代,国产算力成功适配需求爆发将至 行业行业研究研究行业行业快评快评 互联网互联网 投资评级投资评级:优于大市优于大市(维持维持)证券分析师:证券分析师:张伦可张伦可0755-执证编码:S0980521120004证券分析师:证券分析师:陈淑媛陈淑媛021-执证编码:S0980524030003证券分析师:证券分析师:张昊晨张昊晨执证编
2、码:S0980525010001事项:事项:事项事项:4 月 24 日,DeepseekV4 发布。根据 DeepSeek 的官方介绍,V4 系列包含两个 MoE 模型:DeepSeek-V4-Pro总参数 1.6T、激活参数 49B,DeepSeek-V4-Flash 总参数 284B、激活参数 13B,两者均原生支持 100 万 token上下文。国信国信互联网互联网观点:观点:AgentAgent 能力大幅提升能力大幅提升,处于国内第一梯队处于国内第一梯队,性能比肩全球顶级闭源模型性能比肩全球顶级闭源模型。根据公司官方,在 Agentic Coding评测中,V4 Pro 已达到当前开源
3、模型最佳水平。目前 DeepSeek V4 已成为公司内部员工使用的 AgenticCoding 模型,据评测反馈使用体验优于 Sonnet 4.5,交付质量接近 Opus 4.6 非思考模式,但仍与 Opus4.6 思考模式存在一定差距。从第三方评测来看,Arena.ai 在 X 上将 V4 Pro 定性为相较 DeepSeek V3.2的重大飞跃,在代码开源模型榜单中位列第 3 位、综合第 14 位。另一家测评方 Vals AI 表示,V4 在其Vibe Code Benchmark 中是开源模型榜首。DeepseekDeepseek 通过注意力层改进通过注意力层改进,推动百万上下文进入普
4、惠时代推动百万上下文进入普惠时代。DeepSeek V4 开创了一种全新的注意力机制,在 token 维度进行压缩,结合 DSA 稀疏注意力,实现了全球领先的长上下文能力,并且相比于传统方法大幅降低了对计算和显存的需求。在 1M 上下文设置下,DeepSeek V4 Pro 的单 token 推理 FLOPs 只有 V3.2的 27%,KV Cache 只有 10%;V4-Flash 更极端,分别压到 10%和 7%。价格方面,Deepseek 实现了高性价比。DeepSeek-V4-Pro 输入/输出百万 Token 价格 12 元/24 元;对比国内 1T 模型,比如小米输入/输出百万 T
5、oken价格$1/$3(小于 256K 上下文);$2/$6(1M 上下文)。Deepseek-V4-Flash 价格更低,为输入/输出百万 Token 价格 1 元/2 元。DeepseekDeepseek 与国产芯片进行适配与国产芯片进行适配,包括华为包括华为、寒武纪等寒武纪等。V4 在技术报中表示,在英伟达 GPU 和华为昇腾 NPU两个平台上均验证了细粒度 EP(专家并行)方案。根据官网,下半年昇腾 950 超节点批量上市有望继续推动 V4 Pro 降价。根据华为云官方,昇腾一直同步支持 DeepSeek 系列模型,本次通过双方芯模技术紧密协同,实现昇腾超节点全系列产品支持 DeepS
6、eek V4 系列模型。昇腾 950 通过融合 kernel 和多流并行技术降低Attention计算和访存开销,大幅提升推理性能,结合多种量化算法,实现了高吞吐、低时延的DeepSeekV4 模型推理部署。昇腾 A3 超节点系列产品也全面适配,同时为便于用户快速微调,提供了基于昇腾 A3 超节点的训练参考实现。寒武纪 Day 0 适配 DeepSeek-V4。寒武纪已基于 vLLM 推理框架完成 285BDeepSeek-V4-flash 和 1.6T DeepSeek-V4-pro 的 Day 0 适配,适配代码已开源到 GitHub 社区。这一成果得益于寒武纪长期积累的自研 NeuWar