1、Rubin系列全面量产,Vera专为Agent设计性能超x86英伟达(NVDA.O)COMPUTEX2026跟踪报告事件:英伟达CEO黄仁勋6月1日在COMPUTEX2026大会发表主题演讲,介绍公司在AgenticAl领域和VeraRubin机架最新进展,以及VeraCPU等硬件平台与AIPC等技术前沿应用。综合演讲及材料信息,总结要点如下:评论:1、AgenticAl成为利润创造者,Harness为Agent操作系统。英伟达表示AgenticAI时代已经到来,标志着全新的计算模式,不仅仅是生成式AI的延续,更实现了“有用性”的跃升,AI成为利润创造者,可以通过Prompt让它生成代码,并产
2、生输出。智能体作为终极的解构式与分布式计算模型,由模型+Harness(软件底座)+工具+Runtime组成,模型作为大脑,Harness负责调度,使其完成生产性工作,英伟达CUDAX库作为智能体的工具,输入数据后,智能体进行理解、观察、推理、行动并使用工具。工具使用作为最大的突破,不需要担心智能体到来会导致软件公司倒闭,世界上将会出现数以亿计的智能体,将比以往任何时候都更频繁地使用工具。工具运行在CPU和GPU以及大语言模型上,安全Harness运行在CPU和BlueFieldDPU上,所有这些的编排工作都由CPU完成。2、VeraRubin已进入全面量产阶段,机架组装时间缩短至5分钟。Ve
3、raRubin是端到端系统,包含GPU、VeraRubinNVLink72,并由VeraCPU进行协调,目前已全面量产,建立的供应链规模是GraceBlackwell的两倍。架构核心是极端协同设计,其逻辑基于:每一个Token都是收入都是盈利的,计算即营收,计算即利润,而收入和利润的缺失即是损失。VeraRubinAl工厂构建中,1)DSX代表基础设施:NvidiaDSX作为参考设计,通过DSXSIMOmniverse蓝图,合作伙伴可以在动工建设前设计并验证VeraRubinAI工厂;利用DSXMaxLps实现机架间的动态电力分配,将回收的搁浅电力转化为计算产出;通过DSXFlex实时协同电网
4、信号,在电网压力大时动态调整工厂功耗,保持最高运行效率。2)模块化集成:VeraRubin系统由七款3纳米制程新芯片组成,结合CoWoS-R与CoWoS-L封装及各方HBM内存,由VeraRubinNVL72执行模型思考、Prompt处理及推理规划。3)第三代MGX机架设计:系统采用全新的模块化计算链路与流线型PCB中板设计,将两侧直接连接,过去需要两个小时的装配时间,现在仅需五分钟。SuperChips连接X9SuperNyx和BlueField4DPU以提升韧性。4)Groq3LPX架构:16个托盘中集成了256颗Groq3LPU,GroqLPX则负责以最低延迟完成Token生成,与Ver
5、aRubinNVL72架构形成高吞吐与低延迟的互补算力组合。全新的LPXLPU30芯片是核心算力单元。5)VeraCPU机架:单机架内集成256颗液冷CPU,在富士康和Quanta的工厂中运用,搭配CX9芯片及完善的软件栈,是有史以来建造的最先进的CPU。推荐(维持)相关报告3、VeraCPU专为智能体设计,性能相比最高性能的x86处理器进一步提升。传统的CPU追求单插槽核心最大化,智能体时代,CPU已成为GPU利用率的瓶颈,直接影响Token的吞吐量、延迟和用户体验。VeraCPU专为智能体设计,机架内集成了两颗VeraCPU,负责管理GPU、处理KV缓存以及处理机架内的所有软件调度,作为G
6、raceBlueField的核心,用于安全与隔离,同时负责Harness、AI模型编排、工具调用及数据库访问。针对智能体需求的四大特征:1)Vera拥有全球最高的指令执行效率(IPC);2)拥有极高的带宽密度,是首个达到reticlelimits的CPU;3)I/O能力方面,Vera是首个支持PCleGen6的CPU,Vera是首个支持PCleGen6的CPU;4)Vera在提供超高性能的同时,为GPU留出足够的电力空间。Vera是首个使用LPDDR5X内存的CPU,与最高性能的x86处理器进行对比:Vera将峰值