当前位置:首页 > 报告详情

【东方证券】电子行业深度报告:国产算力加速启航-260525(14页).pdf

上传人: 向** 编号:1256828 2026-05-25 14页 960.95KB

1、国产算力加速启航核心观点一、Token爆发:国产大模型持续迭代1.1国产大模型持续迭代国产大模型持续迭代,加速追赶海外顶尖模型。从演进路径来看,国产模型从20232024年的千亿参数通用模型备案放量,发展到2025年多项评测指标与海外缩小区局,再到2026年以万亿参数MoE架构、百万级Token上下文及国产芯片全栈适配代际跃迁,不仅在Agent自主执行、长文本理解与复杂推理等核心维度全面进入全球第一梯队,也推动全球调用量格局变化,据OpenRouter数据,2026年5月中旬中国大模型周调用量达7.94万亿Token,为美国同期的2.11倍,连续数周居全球首位。面对Agent场景爆发式增长、企

2、业级部署加速以及全球开发者向高性价比模型迁移的需求,头部厂商正通过定价策略推进商业化路径(智谱API提价逾80%而调用量仍扩大约4倍、Kimi发布新版后20天收入超上年全年、豆包依托3.5亿月活开启C端付费订阅)。在能力追赶、成本下沉与商业兑现下,国产大模型的渗透率逐步提升。(divcenter)图1:DeepseekV4性能提升(/divcenter)1.2商业逐步闭环,算力供给紧张大模型商业闭环正在加速形成。模型公司的变现链条涉及API调用定价、企业私有化部署、C端付费订阅及Agent框架生态等多重环节。从兑现节奏来看,国内头部厂商的ARR已从2025年底的千万美元量级跃升至2026年一季

3、度的数亿美元规模智谱MaaS平台ARR截至3月突破2.5亿美元,较2025年底增长超6倍,MiniMax截至2月ARR突破1.5亿美元,2026年2月文本模型日均Token消耗较2025年12月增长6倍以上;Kimi在sfK2.5/sfK2.6接连迭代,4月底ARR已超2亿美元。海外来看,Anthropic4月ARR约300亿美元。面对Agent场景爆发带来的Token消耗量提升、以及B端多Agent协同渗透加深的共振,国产模型规模效应提升。性价比驱动Token扩张、扩张拉动算力采购、国产芯片迭代,代工需求提升。大模型的商业闭环形成,算力需求持续释放。算力供给紧张,全链条通胀。AI算力包括GP

4、U/CPU芯片、存储器件、云服务与终端租赁等多环节,任一节点的供给刚性都会沿链条放大传导。上游来看,GPU租赁价格持续攀升,Blackwell系列近期涨幅接近较大,DRAM合约价在2026年一季度环比增长96%、NAND合约价环比增长88%;中游来看,云服务提价,阿里云4月中旬调整算力产品定价,GPU云服务器与模型单元价格分别上调5%sim34%不等。涨价印证推理对算力需求增加。资本开支来看,海外9家CSP的2026年资本开支合计预估已上修至约8300亿美元、同比增速从61%提升至79%,字节跳动将全年AI资本开支上修至2000亿元人民币。二、芯片协同:国产化替代由点到面2.1国产算力芯片性能

5、逐步提升设计迭代与封装突围双线并进,国产算力芯片进展迅速。国产GPU从2023年开始逐步迭代,初期产品主要应用数字孪生、AI云桌面等视觉渲染类负载,依赖GPU图形编码能力而非通用计算能力。从设计端演进来看,2024年之后多家厂商对芯片架构进行面向AI训练的系统性重构,通过自研软件栈实现CUDA算子到原生算子的自动转换、支持CUDAC的编程语言直接开发、配合迁移工具实现近无缝代码移植,降低开发者从英伟达生态切换的成本,国产芯片开始大规模切入训练与推理场景。2025年后产品代际跃升,同时国内HBM量产进度逐步推进,弥补了存储端的缺陷。此外,代工和封装工艺不断升级,在代工端,中芯国际对于26Q2指引

6、2Q26收入环比增长14%至16%,毛利率指引为20%至22%,增速高于以往季度规律,显示下游需求高景气;封装端,比如将两颗裸芯以Chiplet技术合封,可实现单卡算力与互联带宽翻倍。在设计端架构创新+代工封装端进步+软件栈协同等因素合力下,国产算力芯片与海外性能代差缩小。推理需求提升驱动国产芯片加速导入。推理需求加速后产业焦点从单卡性能转向每美元Token产出效率。国产AI芯片在绝对性能上与海外旗舰仍存在代差,以FP16算力、显存带宽与互联带宽三维几何平均衡量,拿H200作为基准,华为昇腾mathsfOmega910mathsfC为61.5%,寒武纪思元590约为49%,多数产品落在25%s

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
客服
商务合作
小程序
服务号
折叠