计算机行业专题研究：推理与Agentic AI浪潮下CPU重回AI基础设施核心中枢-260529-在线下载-三个皮匠报告

1、推理与AgenticAI浪潮下，CPU重回AI基础设施核心中枢本报告导读：推理与AgenticAI正推动AI基础设施从GPU单点算力竞争转向CPU-GPU异构协同竞争，CPU有望由配套组件升级为执行中枢，并带动国产CPU及数据中心配套产业链迎来结构性机遇。投资要点：DAI推理和智能体工作负载催生CPU需求结构性拐点。随着推理请求、多用户并发、长上下文、多Agent协作的增长，CPU负载显著提升，CPU:GPU配比由训练阶段的1:8演进至推理阶段1:3sim1:4，Agent阶段接近1:2。CPU价格上涨、交期延长已初步验证需求回升，未来AI数据中心将从单纯堆GPU转向“CPU+GPU+内存+网

2、络+软件”的整体优化。异构系统和新型CPU架构带来长期投资机会。AI工作负载复杂化推动CPU架构向系统级协同优化演进，包括更多核心、高带宽缓存、CXL互联和新型共享内存架构。CPU与GPU协同成为AI数据中心核心，带动产业链价值提升。上游半导体材料和设备国产化进程加速，中游芯片设计与封装测试自主可控，下游服务器、AI加速及边缘场景需求高增，为整个CPU产业链创造长期投资机会。.国产CPU迎来产业链布局窗口。国际市场上，Intel、AMD和ARM通过优化架构、核心数和异构协同能力占据主导地位，AI推理及智能体工作负载持续推动其服务器CPU需求增长。国产CPU厂商如飞腾、海光信息等正在加速布局，通

3、过自主指令集、RISC-V生态和国产EDA/IP支持，实现服务器及AI算力市场突破。风险提示：AI智能体落地不及预期风险，AI商业化进展不及预期风险，行业竞争加剧及份额流失风险，资本开支周期波动风险。相关报告1推理与AgenticAI时代，CPU重回AI基础设施核心中枢1.1CPU：AI基础设施的大脑，负责控制、调度与串行执行CPU是计算机系统中最核心的通用计算芯片，本质上承担“系统大脑”的角色。与GPU擅长大规模并行计算不同，CPU更擅长复杂逻辑判断、低延迟响应、分支控制、任务调度和串行执行。在传统计算机系统中，CPU负责执行程序指令、控制其他硬件、处理逻辑判断和数据运算，是整个系统运行的控

4、制中枢。其核心职责可以概括为三类：一是指令调度，即将软件层指令翻译为硬件可执行的操作；二是逻辑判断，即根据复杂条件执行不同路径;三是串行控制，即对具有先后依赖关系的任务进行稳定执行。CPU与GPU的分工，本质上是“复杂控制”与“大规模并行”的分工。GPU拥有大量计算核心，擅长处理矩阵乘法、Attention计算、图像渲染等高度规则、可并行化任务；CPU则拥有更强的单核能力、更复杂的控制单元、更大的缓存层级和更灵活的I/O调度能力，更适合处理不规则、事件驱动、强分支、强交互的任务。若用AI系统来类比，GPU负责“算”，CPU负责“管；GPU决定单次神经网络计算效率，CPU决定整个推理系统的调度效

5、率、任务流转效率和系统稳定性。(divcenter)图1：CPU预留芯片面积用于大型缓存、控制单元等(/divcenter)1.2推理时代到来，系统瓶颈开始从GPU转向CPU过去两年，AI基础设施的核心矛盾主要集中在“训练算力不足”，GPU因此成为整个产业链最核心的资源。大模型训练本质上是高度规则化、可并行化的矩阵运算，系统目标是让GPU持续高负载运行，因此CPU更多承担数据搬运、任务调度和主机管理等辅助职责。在这一阶段，行业对于AIInfra的理解几乎等同于“GPU基础设施：HBM容量、NVLink带宽、GPU集群规模决定了训练效率，CPU则逐渐被边缘化。传统CPU中心的数据中心架构已经演变

6、为“GPU中心”，原因在于LLM每生成一个token，都需要读取海量模型参数，传统CPU+内存体系的带宽与算力已经无法满足这种计算密度，因此计算与通信大量offload到GPU完成，CPU逐渐成为“辅助处理器”。在训练时代，这种“GPU绝对核心化”的逻辑是成立的，因为训练任务单一、重复且高度并行，系统瓶颈天然集中于浮点算力与显存带宽。但随着AI产业逐渐从“模型训练”进入“模型推理”阶段，整个系统的工作负载开始发生根本性变化。训练的核心是大规模并行计算，而推理的核心则是复杂请求的实时处理与系统调度。尤其是在企业级AI应用中，一次推理请求往往并不只是简单执行一次前向传播，而是伴随着检索增强(RAG

计算机行业专题研究：推理与Agentic AI浪潮下CPU重回AI基础设施核心中枢-260529（36页）.pdf

计算机行业专题研究：推理与Agentic AI浪潮下CPU重回AI基础设施核心中枢-260529（36页）.pdf