当前位置:首页 > 报告详情

2026年计算机行业中期策略:从训练到推理时代的拐点-260617(25页).pdf

上传人: N** 编号:1269172 2026-06-18 25页 3.12MB

下载:

1、从训练到推理时代的拐点从训练到推理时代的拐点2026年计算机行业中期策略年计算机行业中期策略分析师:郑宏达 S0800524020001 邮箱地址:分析师:谢忱S0800524040005 邮箱地址:分析师:李想S0800525040006 邮箱地址:分析师:卢可欣 S0800525080006 邮箱地址:分析师:王朗S0800526040009 邮箱地址:西部证券研发中心 2025年6月17日证券研究报告请务必仔细阅读报告尾部的投资评级说明和声明核心结论核心结论22026年是年是AI从训练转向推理主导的拐点从训练转向推理主导的拐点。OpenClaw、ClaudeCode等开源与闭源Agent

2、框架以燎原之势迅速普及,算力的应用从训练走向智能体等推理需求主导,从问答模式走向智能体循环,从单轮生成升级为多步规划、持续执行,推理首超训练成为算力需求的重心。进入推理时代,算力基础设施的核心关注点是Token成本的低延迟、调度算法和缓存管理,通过极致优化实现高效服务。在芯片层,以Groq LPU为代表的专用推理芯片兴起,推动推理能力和效率普惠,并与GPU结合进行异构计算,实现性能互补;在网络互联层,超节点以高速互联、内存池化、高度集成等优势精准适配推理高并发、实时交互和大显存消耗需求,助推系统向万卡集群演进,以太网交换机凭借其普适性和经济性,有望成为AI时代数据中心网络架构的主流选择。模型层

3、面,Claude Opus 4.8、GPT 5.5、GLM-5.1、DeepSeek V4、Minimax-M3等前沿模型密集发布,模型迭代节奏进一步加快,模型能力提升聚焦agent、coding与多模态,进一步迈向生产力级别的智能。展望展望2026年下半年:芯片年下半年:芯片、互联互联、算力算力,技术进步与整体需求依旧蓬勃发展技术进步与整体需求依旧蓬勃发展,模型能力的边界有望模型能力的边界有望进一步拓展进一步拓展,助推助推AI应用的深度和广度持续提升应用的深度和广度持续提升。建议关注方向:1)国内外模型商业化提速,规模化应用有望带动Tokens消耗高增,继续看好AI算力。2)国产模型能力持续

4、提升,具备性能和性价比优势,继续看好国产模型厂商。3)模型应用有望在B端、C端持续展开,看好具备垂直行业know-how的AI应用厂商。风险提示风险提示:AI 技术突破不及预期;大模型应用落地节奏不及预期;宏观经济增长不及预期,IT预算不及预期;国际环境发生变化。行业评级行业评级超配超配前次评级前次评级超配评级变动评级变动维持相对表现相对表现 1个月个月 3个月个月 12个月个月计算机计算机-11.21-11.241.07沪深沪深3001.486.34 27.41近一年行业走势近一年行业走势-4%1%6%11%16%21%26%31%计算机沪深300XVOWwPmPxOqPrOpOtMrNpQ

5、8OdNaQnPrRtRoQfQnNtNjMoPuM8OrRuNNZoNnPuOmQsNCONTENTS目目录录CONTENTS目目 录录推理时代需要怎样的硬件和软件架构体系推理时代的模型层投资建议010203智能体框架流行,推理时代开始智能体框架流行,推理时代开始风险提示0405请务必仔细阅读报告尾部的投资评级说明和声明推理算力占比快速提升推理算力占比快速提升,2026年首超训练成为算力主体年首超训练成为算力主体4推理首超训练推理首超训练,算力重心发生根本性转移:算力重心发生根本性转移:AI模型生命周期分训练与推理两段训练是“一次性建厂”式的集中投入,模型一旦定型、成本即趋于收敛;推理则是“

6、724永续调用”,每一次用户请求、每一步Agent任务都在持续消耗算力,需求随用户普及与智能体长任务能力快速增长。算力的应用从训练走向推理主体及智能体主导,算力的架构技术、应用场景、商业模式等发生显著变化:从阅读检索到深度思考从单轮生成升级为多步规划、持续执行;算力架构从注意力经济到生产力经济;智能体驱动从被动问答转向主动任务执行;部署形态从纯云端走向“云边端”协同;商业模式从成本中心到价值引擎。根据麦肯锡公司,预计到2030年推理将超越训练,占到全球数据中心AI算力需求的一半以上,推理侧将成为未来几年算力投资的重要增量。中国推理需求倍数更高:中国推理需求倍数更高:在国产替代与应用落地的双重驱

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
1. **2026年AI进入推理时代**:推理算力需求首超训练,成为算力主体,中国推理需求达训练的8倍(邬贺铨院士数据)。 2. **Token消耗激增**:OpenRouter平台周Token处理量从2025年11月5万亿增至2026年5月25万亿(半年增长5倍)。 3. **硬件架构变革**: - 专用推理芯片(如Groq LPU)兴起,与GPU异构计算; - 超节点集群(如华为CloudMatrix 384)支持万卡级扩展; - 以太网交换机(RoCE技术)成主流,光交换机(OCS)市场年复合增长率27.7%。 4. **模型能力升级**:Claude Opus 4.8、GPT-5.5等模型密集发布,聚焦Agent与多模态;国产模型(如DeepSeek V4)性价比凸显。 5. **商业化提速**:ChatGPT月活超9亿,Anthropic ARR达440亿美元;国内AI原生App月活4.4亿。
推理时代何时来? 算力如何变革? 模型能力怎么升?
客服
商务合作
小程序
服务号
折叠