当前位置:首页 > 报告详情

计算机行业AI 2026算力系列(四):GTC英伟达升级Agent算力产品国内AI产业迎来新契机-260317(10页).pdf

上传人: YY 编号:1191060 2026-04-15 10页 1.51MB

下载:

1、GTC英伟达升级Agent算力产品,国内AI产业迎来新契机核心观点:GTC大会上,英伟达针对Agent应用展示了多款AI算力新产品。2026年3月16日,英伟达在GTC大会上展示了多款AI算力产品,包括VeraRubinNVL72超节点产品、Groq3LPU和LPX以及NemoClaw等。从其推出的产品方向来看,英伟达在重点加强针对Agent应用在集群化算力和推理算力产品线的竞争力。具体看,1与Blackwell架构下的超节点产品相比,VeraRubinNVL72推理性能实现5倍的提升,训练性能实现3.5倍的提升。VeraRubin架构的集群能力的提升有望更好满足科技厂商对于加速万亿参数AI模

2、型、多模态大模型及Agent推理任务的算力需求。2针对Agent推理场景常见的长上下文和低延迟的需求,英伟达推出了专用芯片Groq3LPU。融合了模型和Agent算法原理的LPU专用芯片产品在计算性能上有明显提升,这反映了芯片和算法融合发展的趋势已愈发明显。3针对多智能体协同场景,Dynamo软件栈通过KV-Cache存储优化、大语言模型动态路由以及分步推理技术实现了较好的性能提升。4cuVS向量加速软件栈主要通过加速和优化向量检索和搜索的过程来赋能数据挖掘和语义搜索场景。5NemoClaw采用英伟达Agent工具包优化OpenClaw的典型应用;NemoClaw的推出验证了此前报告的观点“小

3、龙虾或改变未来软件应用架构、渠道和运营体系,正成为入口之争”。Agent推动推理算力需求快速增加,AI芯片国产替代空间打开。此次GTC大会上,英伟达不仅在芯片和超节点等硬件层面加强了Agent相关算力性能,还通过Dynamo、NemoClaw等软件栈进一步适配Agent的应用。这反映了未来Agent带来推理算力需求快速增加的趋势。一方面,受政策影响,包括VeraRubin在内的英伟达AI芯片在国内的销售仍面临较大不确定性;另一方面,由于推理AI芯片性能要求较低,国产AI芯片在技术上追赶海外以英伟达为代表的AI芯片的难度更低。在此趋势下,AI芯片国产替代的进程有望加快,远期空间有望进一步被打开。

4、此外,AI基础软件亦受益于Agent相关应用的落地和拓展。VeraRubin和LPU芯片设计采用的新方案可能要求下游晶圆厂新建产线。产线建设周期较长,短期内产能有限可能导致能产出的VeraRubin芯片数量有限。(二)中美在AI算力领域的差距拉大,国内AI产业链追赶存在挑战海外科技公司在采用VeraRubin芯片后有望降低其开发和应用AI模型的成本;受政策影响,VeraRubin芯片可能难以向中国市场销售,或影响国内AI大模型开发和商业化落地节奏。(三)政策的不确定性影响AI芯片供给政策对英伟达AI算力产品在中国的销售限制影响了AI芯片的正常供给,对以互联网为代表的下游客户开发和应用AI相关产品是重大挑战。

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
客服
商务合作
小程序
服务号
折叠