当前位置:首页 > 报告详情

太极 Angel 助力生成式大模型高效落地-刘凯.pdf

上传人: 张** 编号:164025 2024-05-31 30页 8.70MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要探讨了生成式大模型的高效落地及其面临的挑战,以腾讯的混元大模型为例,介绍了刘凯自2019年以来在模型推理、压缩和优化方面的工作。关键数据包括:模型规模快速增长,设备能力提升缓慢,禁令导致硬件选择受限,模型训练和推理的显存和计算优化需求,以及如何使用国产芯片打造大模型等。文章提出了太极Angel-HCF和Angel-SNIP等解决方案,以优化大模型的训练和推理效率,降低成本,并缓解激活空间显存的压力。此外,还探讨了模型压缩技术,如量化压缩和蒸馏压缩,以及如何在大模型基础上快速裁剪出性能相当的小模型。文章还介绍了腾讯混元大模型在多个业务场景的应用,并强调了在实际场景中选择最适合的模型优化方法的重要性。
"腾讯Angel如何优化大模型推理效率?" "生成式AI技术部署挑战有哪些?腾讯的解决方案是什么?" "如何通过Angel-HCF和Angel-SNIP实现生成式AI模型的无损压缩?"
客服
商务合作
小程序
服务号
折叠