当前位置:首页 > 报告详情

预训练时代的机器翻译.pdf

上传人: li 编号:29541 2021-02-07 57页 3.08MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要探讨了神经机器翻译的前训练方法,并提出了一种名为mRASP的新型多语言机器翻译预训练模型。mRASP通过在多个双向翻译对上进行预训练,旨在建立一个通用且易于微调的翻译模型。文章指出,传统的基于单语料库的预训练方法在低资源语言对的翻译上效果不佳。mRASP通过随机替换源语言单词为其在不同语言中的同义词,来拉近不同语言的语义空间。实验结果显示,mRASP在低资源和高资源场景下均能显著提升机器翻译性能,并且在面对未见语言时也表现出色。与现有预训练方法相比,mRASP在大多数语言对上都能取得更好的效果。文章最后呼吁建立一个通用的多语言翻译模型,以适应不同语言对的翻译需求。
"如何提升机器翻译性能?" "多语言预训练有哪些优势?" "如何实现低资源语言的机器翻译?"
客服
商务合作
小程序
服务号
折叠