近日,我中心自然语言处理研究组一篇论文被IEEE/ACM Transactions on Audio, Speech and Language Processing(T-ASLP)期刊录用。T-ASLP期刊是是音频、声学、语言信号处理的顶级期刊,在CCF学术推荐列表中认定为B类刊物,清华计算机学术推荐列表中认定为A类刊物。录用文章题目为Exploring Multi-stage Information Interactions for Multi-source Neural Machine Translation,由我中心2021届硕士研究生陆紫耀,小米公司李响博士、崔建伟博士、王斌博士,清华大学刘洋教授,我中心2019级硕士研究生周楚伦,苏州大学张民教授,我中心苏劲松教授(通讯作者)合作完成。

论文研究提出了一种面向多源机器翻译的多阶段编码器和一种基于互蒸馏的训练框架。其中多阶段编码器分为单源内部建模和多源交互建模两个部分,加强了模型对于多源输入句子的建模能力。在训练阶段,使用单源翻译模型与多源翻译模型相互蒸馏的方式,强化模型对每个输入源的理解能力。论文在WMT14英德法数据集上,对比现有模型取得了显著的性能提升,并通过详细的实验分析分别证明了所提方法中每个部件的有效性。
该工作得到了国家自然科学基金(No. 62036004, No. 61672440)、福建省自然科学杰出青年基金(No.2020J06001)、厦门青年创新基金(Grant No. 3502Z20206059)等的资助。