当前位置:首页 > 报告详情

王骁_端侧大模型部署:存储系统面临的挑战和优化实践.pdf

上传人: 柒柒 编号:1268209 2026-06-13 42页 6.29MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
1. 端侧大模型部署面临四大挑战:模型加载耗时长(3B模型达10s)、内存申请耗时波动大(1~4s)、随机数据占比高(4K占23.93%)、存储带宽差距大(30GB/s+)及功耗超50%。 2. 优化实践: - 采用udmabuf方案,模型加载速度提升50%+,耗时降至1s内; - EROFS文件系统支持Direct I/O,低内存场景性能提升54%; - Uncached Buffer IO降低kswapd负载,但写性能需优化; - 基于Zone的分类存储提升随机读性能30%; - 并行内存回收提升回收速度15%。 3. 未来展望:存算一体(如3D DRAM+NPU)将推动存储系统变革,需突破高效管理与硬件协同。
**模型加载慢?** **内存耗时长?** **存储功耗高?**
客服
商务合作
小程序
服务号
折叠