1、推理与AgenticAI浪潮下,CPU重回AI基础设施核心中枢本报告导读:推理与AgenticAI正推动AI基础设施从GPU单点算力竞争转向CPU-GPU异构协同竞争,CPU有望由配套组件升级为执行中枢,并带动国产CPU及数据中心配套产业链迎来结构性机遇。投资要点:DAI推理和智能体工作负载催生CPU需求结构性拐点。随着推理请求、多用户并发、长上下文、多Agent协作的增长,CPU负载显著提升,CPU:GPU配比由训练阶段的1:8演进至推理阶段1:3sim1:4,Agent阶段接近1:2。CPU价格上涨、交期延长已初步验证需求回升,未来AI数据中心将从单纯堆GPU转向“CPU+GPU+内存+网
2、络+软件”的整体优化。异构系统和新型CPU架构带来长期投资机会。AI工作负载复杂化推动CPU架构向系统级协同优化演进,包括更多核心、高带宽缓存、CXL互联和新型共享内存架构。CPU与GPU协同成为AI数据中心核心,带动产业链价值提升。上游半导体材料和设备国产化进程加速,中游芯片设计与封装测试自主可控,下游服务器、AI加速及边缘场景需求高增,为整个CPU产业链创造长期投资机会。.国产CPU迎来产业链布局窗口。国际市场上,Intel、AMD和ARM通过优化架构、核心数和异构协同能力占据主导地位,AI推理及智能体工作负载持续推动其服务器CPU需求增长。国产CPU厂商如飞腾、海光信息等正在加速布局,通
3、过自主指令集、RISC-V生态和国产EDA/IP支持,实现服务器及AI算力市场突破。风险提示:AI智能体落地不及预期风险,AI商业化进展不及预期风险,行业竞争加剧及份额流失风险,资本开支周期波动风险。相关报告1推理与AgenticAI时代,CPU重回AI基础设施核心中枢1.1CPU:AI基础设施的大脑,负责控制、调度与串行执行CPU是计算机系统中最核心的通用计算芯片,本质上承担“系统大脑”的角色。与GPU擅长大规模并行计算不同,CPU更擅长复杂逻辑判断、低延迟响应、分支控制、任务调度和串行执行。在传统计算机系统中,CPU负责执行程序指令、控制其他硬件、处理逻辑判断和数据运算,是整个系统运行的控
4、制中枢。其核心职责可以概括为三类:一是指令调度,即将软件层指令翻译为硬件可执行的操作;二是逻辑判断,即根据复杂条件执行不同路径;三是串行控制,即对具有先后依赖关系的任务进行稳定执行。CPU与GPU的分工,本质上是“复杂控制”与“大规模并行”的分工。GPU拥有大量计算核心,擅长处理矩阵乘法、Attention计算、图像渲染等高度规则、可并行化任务;CPU则拥有更强的单核能力、更复杂的控制单元、更大的缓存层级和更灵活的I/O调度能力,更适合处理不规则、事件驱动、强分支、强交互的任务。若用AI系统来类比,GPU负责“算”,CPU负责“管;GPU决定单次神经网络计算效率,CPU决定整个推理系统的调度效
5、率、任务流转效率和系统稳定性。(divcenter)图1:CPU预留芯片面积用于大型缓存、控制单元等(/divcenter)1.2推理时代到来,系统瓶颈开始从GPU转向CPU过去两年,AI基础设施的核心矛盾主要集中在“训练算力不足”,GPU因此成为整个产业链最核心的资源。大模型训练本质上是高度规则化、可并行化的矩阵运算,系统目标是让GPU持续高负载运行,因此CPU更多承担数据搬运、任务调度和主机管理等辅助职责。在这一阶段,行业对于AIInfra的理解几乎等同于“GPU基础设施:HBM容量、NVLink带宽、GPU集群规模决定了训练效率,CPU则逐渐被边缘化。传统CPU中心的数据中心架构已经演变
6、为“GPU中心”,原因在于LLM每生成一个token,都需要读取海量模型参数,传统CPU+内存体系的带宽与算力已经无法满足这种计算密度,因此计算与通信大量offload到GPU完成,CPU逐渐成为“辅助处理器”。在训练时代,这种“GPU绝对核心化”的逻辑是成立的,因为训练任务单一、重复且高度并行,系统瓶颈天然集中于浮点算力与显存带宽。但随着AI产业逐渐从“模型训练”进入“模型推理”阶段,整个系统的工作负载开始发生根本性变化。训练的核心是大规模并行计算,而推理的核心则是复杂请求的实时处理与系统调度。尤其是在企业级AI应用中,一次推理请求往往并不只是简单执行一次前向传播,而是伴随着检索增强(RAG