1、英伟达吸收Groq定义AI下半场!华泰研究Groq交易是英伟达迄今披露的最大一笔交易,规模明显高于其2019年以69亿美元收购Mellanox。我们认为,Groq所掌握的低时延推理核心IP在战略层面的重要性,已与当年Mellanox的互连与网络技术处于同一量级。该交易进一步凸显英伟达对确定性、BatchSize=1推理的前瞻性布局,契合行业向AgenticAI演进的整体趋势。通过将Groq的确定性“反射式引擎”深度整合至CUDA与GPU技术栈,英伟达正加速推动Agentic经济走向主流,并在其已确立优势的AI“上半场”基础上,逐步奠定低时延为核心特征的“下半场”的技术与规则框架。Acqui-h
2、ire模式锁定Groq的LPU人才与核心IP英伟达对价约200亿美元获得Groq推理技术的授权、收购部分知识产权,并引入Groq核心工程团队,包括创始人兼CEOJonathanRoss(原TPU架构师)与总裁SunnyMadra。此次交易价格较Groq25年9月最新私募融资估值的69亿美元隐含接近3倍溢价。从交易结构看,本次交易为IP授权叠加人才收购(Acqui-hire)的组合,而非完整的公司并购。GroqCloud云服务将作为独立公司继续运营,由原CFOSimonEdwards出任CEO。我们认为,这种“精准打击式”的交易结构,使英伟达能够在获取关键低时延推理IP的同时,有效规避整合硬件竞
3、争对手带来的并购与监管不确定性。英伟达以收购Groq定义AI“下半场”规则我们认为,该交易反映英伟达对AgenticAI时代需求结构变化的判断,即时延正成为继算力之后的关键约束因素。据CNBC报道,英伟达CEO黄仁勋在内部邮件中指出,此次交易的核心目标在于将Groq的低时延技术整合进英伟达的AI工厂。在此基础上,英伟达通过引入面向AgenticAI的低时延加速器,开始主动定义AI“下半场”的技术标准。在2025年被普遍视为PhysicalAI元年之后,我们认为2026年有望成为AgenticAI元年,其核心特征在于,AI工作负载将从以吞吐量为导向的训练阶段,转向为对时延高度敏感、执行过程具备确
4、定性的实时应用阶段。我们认为,英伟达将把握这一关键时间节点,通过收购Groq为Agentic应用的规模化落地提供关键支撑,通过整合专用推理IP与其CUDA和GPU技术体系,英伟达得以在训练与实时推理两种核心范式下同时建立领先能力,并在一定程度上削弱云厂商依托自研芯片、从推理侧切入竞赛的潜在空间。从TPU到Dojo与Groq,计算架构趋同下的战略分化我们认为,Groq、TeslaDojo以及谷歌TPU在底层均继承张量加速器的共同技术基因,但三者围绕AI工作负载的不同侧重点差异化设计。尽管Dojo与Groq同样依赖大规模片上SRAM与紧耦合的Scale-up互连,Tesla选择将这一架构优势主要投
5、向大规模、高吞吐的FSD训练场景,而非更适合发挥其低时延潜力的BatchSize=1推理场景。相比之下,谷歌TPU虽起源于JonathanRoss主导的“以推理为先”的设计理念,但其路线已演进为以HBM与OCS为核心的Pod级吞吐引擎,用于支撑大模型训练与推理。在体系结构上,TPU与Groq的Mega-Chip理念存在呼应,但面向批处理的范式不同。我们认为,Groq或延续并强化“推理优先”的设计理念,通过确定性调度与片上SRAM带宽的协同优化,重点覆盖Agentic时代的低时延、交互式推理场景,并形成对科技巨头自研加速器的差异化优势。风险提示:技术落地缓慢、需求不及预期等。问题1:Groq是什
6、么?其架构在AI发展中有何战略意义?Groq的核心产品是LanguageProcessingUnit(LPU),是面向推理计算阶段专门设计的ASIC,其出发点并非追求更高的算力规模,而是解决通用GPU架构中长期存在的“时延-吞吐权衡(latency-throughputtradeoff)”问题。我们认为,Groq本质上体现对交互式AgenticAI趋势未来主流化的押注:在这一趋势下,性能评价指标正从“每单位价格所能处理的总token数量”转向“单次请求的响应速度”。与以训练和高吞吐批处理为核心优化目标的英伟达GPU不同,Groq从设计开始即围绕实时、交互式推理场景进行设计,其核心价值主张在于D