当前位置:首页 > 报告详情

崔慧敏_编译技术在AI软件栈中的实践分享.pdf

上传人: 柒柒 编号:1268190 2026-06-13 55页 13.95MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
1. **私有化部署需求激增**:2025-2027年一体机需求量预计从15万台增至72万台,市场空间达5208亿元(增幅321%);2027年央企国企核心系统需100%信创替代。 2. **AI基础设施挑战**:硬件异构(GPU/NPU/CPU)、优化门槛高、软硬件协同低;推理算力未来3年增幅超6倍,私有化部署占比将从13%升至26%。 3. **SigInfer引擎创新**:通过长上下文优化(显存利用率提升640倍)、PD配比分析、EPD分离及深度融合算子,实现高性能推理,适配国产算力(如昇腾910B)。 4. **国产CUDA兼容实践**:基于2D向量化编译技术(昇腾/寒武纪)及CUTLASS优化(DCU),性能达GPU的74%-108%。 5. **AI for Compiler**:采用VEGA模型生成编译器后端,正确率68.3%,推动大语言模型辅助编译器开发。 6. **未来方向**:算力泛在异构、能效密度提升、Agent导向框架、AI-Native平台统一调度。
**AI编译技术如何突破性能瓶颈?** **国产芯片如何兼容CUDA生态?** **AI软件栈未来发展方向是什么?**
客服
商务合作
小程序
服务号
折叠