当前位置:首页 > 报告详情

2893 - IBM Storage Ceph 在 AI_ML 工作负载领域的应用.pdf

上传人: 竿*** 编号:983011 2025-11-29 16页 441.09KB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
- **会议主题**:IBM Storage Ceph在AI/ML工作负载中的应用 - **主讲人**:Kyle Bader,IBM Storage首席架构师 - **核心概念**:异构推理预填充/解码解耦KV缓存,优化TCO - **技术要点**: - 推理KV缓存:通过缓存加速推理过程,减少计算时间 - 预填充率衰减:随着新token的生成,逐渐减少预填充率 - 模型参数:Qwen/Qwen3-32B,隐藏层大小5120,注意力头数64 - KV缓存大小:约0.0391 GB - **架构**: - DynamoNIXLCeph RGW:请求缓存块,管理KV缓存块和缓存逻辑 - 高性能IO层:缓存块持久化 - **性能**: - 30 GB/s ≈ 196,400 Qwen3-32B tokens per second - 1MB ops ≈ 8 token block size
Ceph如何优化KV缓存?" KV缓存如何提升推理效率?" "Ceph在AI/ML工作负载中的应用解析"
客服
商务合作
小程序
服务号
折叠