《电子行业专题研究:AI的进击时刻24-AI推理上下文存储平台利好SSD-260112(11页).pdf》由会员分享,可在线阅读,更多相关《电子行业专题研究:AI的进击时刻24-AI推理上下文存储平台利好SSD-260112(11页).pdf(11页珍藏版)》请在三个皮匠报告上搜索。
1、AI推理上下文存储平台利好SSD核心观点:英伟达推出AI推理上下文存储平台。英伟达在2026CES正式发布推理上下文内存存储平台(NVIDIAContextMemoryStoragePlatform)。该平台的发布标志着AI计算范式的一次根本性转变:AI工作负载正从传统的短上下文、单轮交互模式,全面转向长上下文、多轮对话以及多智能体(AgenticAI)协同执行的复杂场景。该平台基于BlueField-4与Spectrum-XEthernet加速,与NVIDIADynamo和NVLink紧密耦合,实现内存、存储、网络之间的协同上下文调度,该平台将上下文作为一等数据类型处理,可实现5倍的推理性能
2、、5倍的更优能效。具体来看,每个存储tray搭配4个BlueField-4DPU,每个BlueField-4DPU管理150TB上下文内存空间,通过这种设计,每块GPU将额外获得16TB的上下文内存支持,带宽为200Gbps。单个GPU对应的eSSD容量增长显著。根据我们外发的报告AI的进击时刻21:AI&存储服务器用eSSD空间广阔,根据NvidiaNVL72byHPE白皮书,每个计算tray的缓存盘总容量为30TB(由8块3.84TBNVMeSSD组成),操作系统盘为1块1.92TBNVMeSSD,即单GPU对应2个本地SSD卡槽。我们假设单GPU对应2个本地SSD卡槽;单卡槽对应的eSS
3、D容量为4TB。根据我们测算,H100对应的eSSD需求为4TB,B100/200对应的eSSD需求为8TB,乐观情况下,Rubin对应的eSSD需求为24TB,AI服务器本地、AI推理SSD需求将进一步扩大。一、AI推理上下文存储平台利好eSSD(divcenter)图1:英伟达dynamo系统(/divcenter)(divcenter)图6:柜内每个GPU拥有1TB内存容量(/divcenter)二、AI推理与数据存储构成eSSD核心增量需求场景(divcenter)图10:AI服务器中的SSD应用主要集中于训练、推理与数据存储三大场景(/divcenter)超长上下文与多模态交互推理显
4、著推升KVCache存储需求,AI工作负载对高带宽、大容量SSD的需求将持续增强,AI服务器本地、AI推理用SSD市场空间将进一步扩大。建议关注产业链核心受益标的。(一)AI产业发展以及需求不及预期若AI相关模型和应用发展或下游需求发展不如预期,使得产业发展不如预期,进而影响AI服务器需求。(二)AI服务器出货量不及预期AI服务器出货量一方面受到企业IT支出,尤其是云计算厂商的Capex支出影响,因此若企业对算力设施的投入不及预期,可能影响AI服务器的出货量;另一方面AI服务器价值量占比较高的GPU和CPU若出现供应紧张等问题,也会对AI服务器的出货量级和节奏造成一定消极影响。(三)国产厂商技术和产品进展不及预期目前国内厂商不断开发模型以及相关应用,若在算力、数据、算法等某一因素上支撑不及预期,则可能导致国内厂商技术和产品进展不及预期。