当前位置:首页 > 报告详情

杨敏-数据驱动下的大模型微调:策略与挑战.pdf

上传人: 哆哆 编号:186290 2024-11-01 74页 9.32MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了大语言模型指令微调的相关内容,包括指令微调的作用、数据集构造、数据筛选方法以及常见的微调算法。指令微调的核心作用是让模型学会使用预训练阶段习得的知识,使之具备正确响应各种输入的能力。数据集构造包括基于已有的NLP数据集构建、基于人类日常需要构建和基于大模型扩充构建。数据筛选方法包括IFD、Superfiltering、MoDS、CaR、Nuggets和LESS等。常见的微调算法有全参数微调、参数高效微调、代理微调和冲突知识更新微调等。
微调数据集如何构建? 参数高效微调算法有哪些? 微调数据如何筛选?
客服
商务合作
小程序
服务号
折叠