当前位置:首页 > 报告详情

冯张驰-LLaMA Factory多模态LLM高效微调原理与实践.pdf

上传人: 哆哆 编号:631143 2025-04-19 54页 14.99MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了ML-Summit的相关内容。冯张驰是LLaMA Factory的核心开发者,北京航空航天大学硕士,曾在ACMMM、KDD等会议发表多篇论文,获得国家奖学金,北航优秀毕业生。演讲主题是LLaMA Factory多模态LLM高效微调原理与实践。多模态大模型演变包括纵向扩展和横向扩展,从BERT-based到MoE,训练数据量越来越大,模型参数量越来越大。LLaMA-Factory具有整体介绍、升级之路、社区支持、LLaMA-Board功能介绍等特点,可支持300+模型数据集随机混合,提供训练推理一站式服务。高效微调算法包括微调方法全覆盖、初始显存分析、多场景显存管理、优化后显存分析等。多模态统一架构包括Template、MM_Plugin、新模型架构Day0适配等。多模态应用案例包括多模态旅游助手、Virgo多模态思考助手等。多模态大模型展望包括EasyR1多模态强化学习框架、多模态大模型=多模态理解+多模态生成等。
"如何实现多模态大模型的有效微调?" "LLaMA Factory有哪些核心特性和优势?" "多模态大模型在未来的发展趋势如何?"
客服
商务合作
小程序
服务号
折叠