当前位置:首页 > 报告详情

宋欢-快手KwaiCoder模型:低成本构建先进代码大模型的实践探索.pdf

上传人: 哆哆 编号:631179 2025-04-19 33页 19.12MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文介绍了快手团队在机器学习领域,特别是代码大模型训练与应用方面的研究成果。宋欢,快手大模型算法专家,分享了一种高效训练代码大模型的方法。该方法通过模型剪枝、知识蒸馏和细粒度合并等技术,以1/30的成本完成了23B宽MoE架构代码续写模型的训练。实验表明,该模型在多个代码领域评测集上达到了新的SOTA水平。此外,模型部署上线后,线上采纳率提升了2pp。未来,快手团队计划进一步探索模型剪枝和知识压缩方案,并构建更强大的代码生成系统。
"如何实现代码大模型的低成本构建?" "快手KwaiCoder模型如何突破SOTA指标?" "如何通过模型裁剪和知识蒸馏提升模型性能?"
客服
商务合作
小程序
服务号
折叠