当前位置:首页 > 报告详情

SemiAnalysis-GTC 2026 – 推理王国扩张 GTC 2026 – The Inference Kingdom Expands(69页).pdf

上传人: 山海 编号:1170946 2026-03-31 69页 38.71MB

下载:
word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
1. **英伟达GTC 2026发布三大新系统**:Groq LPX机架、Vera ETL256(256 CPU/机架,液冷)、STX存储机架,并更新Kyber架构(Rubin Ultra NVL144/NVL576)及CPO路线图(Rubin Ultra NVL576机架间用CPO)。 2. **Groq LPU集成与AFD技术**:LP30芯片(500MB SRAM,1.2 PFLOPs FP8)与GPU协同,通过注意力与前馈网络解耦(AFD)优化推理延迟,LPX机架含32个1U计算托盘(16 LPU/托盘)。 3. **网络与架构升级**:Kyber机架密度提升(144 GPU/机架),NVL576采用8个Oberon机架+CPO互连;Feynman规划NVL1152(8 Kyber机架),可能全CPO。 4. **存储与计算扩展**:CMX平台(KV缓存卸载)+STX参考架构(32 Vera CPU/机架),BlueField-4 DPU推动存储标准化。 5. **供应链影响**:Qualcomm(AlphaWave)提供LP30 SerDes;LP40将转台积电N3P工艺,集成NVLink。
**LPU如何提升推理性能?** **CPO技术如何改变网络架构?** **Vera ETL256为何采用液冷?**
客服
商务合作
小程序
服务号
折叠