当前位置:首页 > 报告详情

单一舟-构建AGI时代的推理基础设施.pdf

上传人: 张** 编号:182426 2024-10-14 29页 6.34MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
标记中的内容中,单一舟作为华为云架构与技术创新部的架构师,讨论了构建AGI时代的推理基础设施的重要性。他指出,在大规模低成本高性能推理方面,训练、对齐和推理是关键步骤。单一舟强调了模型架构与芯片架构的冲突,以及算力、内存和网络的不匹配问题。他提出了分离式内存和资源感知调度的解决方案,以提高推理系统的性价比和利用率。此外,他还提到了LLM模型服务化和LLM代理服务化的重要性,以及从单一模型向复合AI系统架构的转变。单一舟认为,通过这些优化,整体成本可以下降80%,同时提升模型的精度和准确性。
"如何构建AGI时代的推理基础设施?" "AI模型服务与AI代理服务的关键挑战是什么?" "如何提升AI代理服务系统的性价比?"
客服
商务合作
小程序
服务号
折叠