1、ML-SummitML-Summitwww.cpp-www.ml-summit.orgwww.gosim.orgwww.pm-summit.orgML-SummitML-SummitML-SummitML-SummitML-SummitML-Summit程程桥桥 网网易易有有道道A AI I产产品品研研发发技技术术总总监监演演讲讲主主题题:有有道道子子曰曰教教育育大大模模型型落落地地实实践践网易有道机器翻译及大模型业务负责人,承担多项技术攻坚项目,为有道翻译,有道智云,词典笔等产品提供人工智能技术支持,产品服务近亿用户;在NLP领域国际顶级学术会议上发表多篇论文,担任ACL,EMNLP等顶级会
2、议的审稿人,拥有多项发明专利的授权。ML-SummitML-Summit有道子曰大模型落地实践网 易有 道 人 工智 能 研发 总监 程桥2025 全球机器学习技术大会ML-SummitML-Summit子曰大模型在有道的业务应用大模型机器翻译进化之路大模型数理能力提升之法总结目目 录ML-SummitML-Summit01子曰大模型在有道的业务应用ML-SummitML-Summit国内首个教育大模型及应用落地坚持把最先进的技术落地教育,让“学习更加高效和轻松”,践行“夫子教人,各因其材”子曰大模型计算机视觉智能语音AI技术有道神经网络翻译高性能计算ML-SummitML-Summit子曰大
3、模型通过备案,参与标准制定9 月1日,子曰大模型通过深度合成服务算法备案。11月4日,通过国家七部委联合公布的生成式人工智能服务管理暂行办法的备案,成为首批通过备案的教育大模型。参与教育、金融、政务、文旅等大模型系列标准制定ML-SummitML-Summit团体标准 教育通用人工智能大模型标准体系研究报告:国内首个教育大模型“子曰”,及其最新应用成果“有道数字人口语教练”,作为优秀案例被收入汇编待正式发布。教育通用人工智能大模型系列标准:包含五项“团标”总体框架、信息模型、数据规范、测评规范、教学应用要求。2023世界人工智能大会智能教育主题论坛现场2023世界人工智能大会智能教育主题论坛现
4、场ML-SummitML-Summit有道子曰大模型-应用架构“场景为先”的教育垂类大模型-助力教育“因材施教”新范式一目标多场景全适用一基座“子曰”大规模语言模型基座数据管理模型训练模型微调自动化评估prompt工程实时搜索插件生态私有化部署公有云调用离线部署场景定制模型(实现模型与场景的高度契合)LLM翻译AI口语教练AI作文指导语法精讲AI BOX文档问答数字人写前指导/写后批改题目解析/核心观点作文结构/作文素材多维评分/作文总评改进建议/好词好句上下文语境翻译中文语法逻辑中文表达习惯长难句翻译精简翻译类真人形象地道发音真实对话语境循循善诱实时报告单选/填空/句子考点提示句子释义答题思
5、路考点精讲集合创作/问答AIBox帮写AIBox帮润AIBox帮化繁为简任意格式上传基于文档的问答零标志信息提取比ChatGPT便捷直播数字人播报数字人交互数字人ML-SummitML-Summit02大模型机器翻译进化之路ML-SummitML-Summit大模型机器翻译为翻译带来更大的想象空间支持理解上下文推理、篇章级翻译理解准确符合中文语法逻辑、表达习惯表达地道支持精简翻译、指代翻译语义流畅LLM翻译更加的准确、地道、流畅;更好支持篇章级的翻译;支持场景、术语、风格等各种定制化ML-SummitML-Summit真真实场景:数据来源:某次中英互译质量测评,参评结果:友商大模型,有道线上翻
6、译大模型,新版翻译大模型人工标注结果:共计2400个偏好对,基于MQM评估规范人工判定为平局的有868条,非平局的1532条自动化评估结果:平局使用每个模型基于F1值选取的最佳阈值翻译评估模型模型偏好正确率(人工标注非平局)含平局偏好f1_macro含平局偏好f1_microCOMET-Kiwi-XXL58.0142.0942.17Reward Bench领先的通用RM(平局使用最佳阈值结果)Nemotron-70B-RM59.9243.58 44.04Athene-RM-70B59.8641.7741.92国内开源RM160.6444.7545.46国内开源RM260.3842.5842.5