本文经授权转载自公众号「微软研究院AI头条」。

继在语音识别和机器阅读领域取得的“过人”成绩,由微软亚洲研究院与雷德蒙研究院的研究人员组成的团队宣布,其研发的机器翻译系统在通用新闻报道测试集 newstest2017 的中-英测试集上,达到了可与人工翻译媲美的水平。这是首个在新闻报道的翻译质量和准确率上可以比肩人工翻译的翻译系统

newstest2017 新闻报道测试集由产业界和学术界的合作伙伴共同开发,并于去年秋天在 WMT17 大会上发布。为了确保翻译结果准确且达到人类的翻译水平,微软研究团队邀请了双语语言顾问将微软的翻译结果与两个独立的人工翻译结果进行了比较评估。

微软技术院士,负责微软语音、自然语言和机器翻译工作的黄学东称,这是对自然语言处理领域最具挑战性任务的一项重大突破。“在机器翻译方面达到与人类相同的水平是所有人的梦想,我们没有想到这么快就能实现。”他表示,“消除语言障碍,帮助人们更好地沟通,这非常有意义,值得我们多年来为此付出的努力。”

△ 微软技术院士黄学东

机器翻译是科研人员攻坚了数十年的研究领域,曾经很多人都认为机器翻译根本不可能达到人类翻译的水平。

虽然此次突破意义非凡,但研究人员也提醒大家,这并不代表人类已经完全解决了机器翻译的问题,只能说明我们离终极目标又更近了一步

微软亚洲研究院副院长、自然语言计算组负责人周明表示,在 WMT17 测试集上的翻译结果达到人类水平很鼓舞人心,但仍有很多挑战需要我们解决,比如在实时的新闻报道上测试系统等。

微软机器翻译团队研究经理 Arul Menezes 表示,团队想要证明的是:当一种语言对(比如中-英)拥有较多的训练数据,且测试集中包含的是常见的大众类新闻词汇时,那么在人工智能技术的加持下机器翻译系统的表现可以与人类媲美。

△ 微软机器翻译团队研究经理Arul Menezes

跨时区跨领域合作,四大技术为创新加持

虽然学术界和产业界的科研人员致力于机器翻译研究很多年,但近两年深度神经网络的使用让机器翻译的表现取得了很多实质性突破,翻译结果相较于以往的统计机器翻译结果更加自然流畅。

为了能够取得中-英翻译的里程碑式突破,来自微软亚洲研究院和雷德蒙研究院的三个研究组,进行了跨越中美时区、跨越研究领域的联合创新

其中,微软亚洲研究院机器学习组将他们的最新研究成果——对偶学习(Dual Learning)和推敲网络(Deliberation Networks)应用在了此次取得突破的机器翻译系统中

微软亚洲研究院副院长、机器学习组负责人刘铁岩介绍道,“这两个技术的研究灵感其实都来自于我们人类的做事方式。”

对偶学习利用的是人工智能任务的天然对称性。当我们将其应用在机器翻译上时,效果就好像是通过自动校对来进行学习——当我们把训练集中的一个中文句子翻译成英文之后,系统会将相应的英文结果再翻译回中文,并与原始的中文句子进行比对,进而从这个比对结果中学习有用的反馈信息,对机器翻译模型进行修正。

而推敲网络则类似于人们写文章时不断推敲、修改的过程。通过多轮翻译,不断地检查、完善翻译的结果,从而使翻译的质量得到大幅提升。

对偶学习和推敲网络的工作发表在 NIPS、ICML、AAAI、IJCAI 等人工智能的全球顶级会议上,并且已被其他学者推广到机器翻译以外的研究领域。

△ 微软亚洲研究院副院长、机器学习组负责人刘铁岩

周明带领的自然语言计算组多年来一直致力于攻克机器翻译,这一自然语言处理领域最具挑战性的研究任务。周明表示,“由于翻译没有唯一的标准答案,它更像是一种艺术,因此需要更加复杂的算法和系统去应对。”

自然语言计算组基于之前的研究积累,在此次的系统模型中增加了另外两项新技术:联合训练(Joint Training)和一致性规范(Agreement Regularization),以提高翻译的准确性。

联合训练可以理解为用迭代的方式去改进翻译系统,用中英翻译的句子对去补充反向翻译系统的训练数据集,同样的过程也可以反向进行。一致性规范则让翻译可以从左到右进行,也可以从右到左进行,最终让两个过程生成一致的翻译结果。

△ 微软亚洲研究院副院长、自然语言计算组负责人周明

可以说,两个研究组分别将各自所在领域的积累与最新发现应用在了此次的机器翻译系统中,从不同角度切入,让翻译质量大幅提升。在项目合作过程中,他们每周都会与雷德蒙总部的团队开会讨论,确保技术可以无缝融合,系统可以快速迭代。

没有“正确的”翻译结果

newstest2017 新闻报道测试集包括约 2000 个句子,由专业人员从在线报纸样本翻译而来。微软团队对测试集进行了多轮评估,每次评估会随机挑选数百个句子翻译。

为了验证微软的机器翻译是否与人类的翻译同样出色,微软没有停留在测试集本身的要求,而是从外部聘请了一群双语语言顾问,将微软的翻译结果与人工翻译进行比较。

验证过程之复杂也从另一个侧面体现了机器翻译要做到准确所面临的复杂性。对于语音识别等其它人工智能任务来说,判断系统的表现是否可与人类媲美相当简单,因为理想结果对人和机器来说完全相同,研究人员也将这种任务称为模式识别任务。

然而,机器翻译却是另一种类型的人工智能任务,即使是两位专业的翻译人员对于完全相同的句子也会有略微不同的翻译,而且两个人的翻译都不是错的。

那是因为表达同一个句子的“正确的”方法不止一种。 周明表示:“这也是为什么机器翻译比纯粹的模式识别任务复杂得多,人们可能用不同的词语来表达完全相同的意思,但未必能准确判断哪一个更好。”

复杂性让机器翻译成为一个极有挑战性的问题,但也是一个极有意义的问题。刘铁岩认为,我们不知道哪一天机器翻译系统才能在翻译任何语言、任何类型的文本时,都能在“信、达、雅”等多个维度上达到专业翻译人员的水准。

不过,他对技术的进展表示乐观,因为每年微软的研究团队以及整个学术界都会发明大量的新技术、新模型和新算法,“我们可以预测的是,新技术的应用一定会让机器翻译的结果日臻完善。”

研究团队还表示,此次技术突破将被应用到微软的商用多语言翻译系统产品中,从而帮助其它语言或词汇更复杂、更专业的文本实现更准确、更地道的翻译。此外,这些新技术还可以被应用在机器翻译之外的其他领域,催生更多人工智能技术和应用的突破

延伸阅读

对偶学习(Dual Learning)

对偶学习的发现是由于现实中有意义、有实用价值的人工智能任务往往会成对出现,两个任务可以互相反馈,从而训练出更好的深度学习模型。例如,在翻译领域,我们关心从英文翻译到中文,也同样关心从中文翻译回英文;在语音领域,我们既关心语音识别的问题,也关心语音合成的问题;在图像领域,图像识别与图像生成也是成对出现。此外,在对话引擎、搜索引擎等场景中都有对偶任务。

一方面,由于存在特殊的对偶结构,两个任务可以互相提供反馈信息,而这些反馈信息可以用来训练深度学习模型。也就是说,即便没有人为标注的数据,有了对偶结构也可以做深度学习。

另一方面,两个对偶任务可以互相充当对方的环境,这样就不必与真实的环境做交互,两个对偶任务之间的交互就可以产生有效的反馈信号。

因此,充分地利用对偶结构,就有望解决深度学习和增强学习的瓶颈——训练数据从哪里来、与环境的交互怎么持续进行等问题。

■ 论文 | Dual Learning for Machine Translation

■ 链接 | https://www.paperweekly.site/papers/546

■ 源码 | https://github.com/thompsonb/DL4MT

△ 对偶无监督学习框架

推敲网络(Deliberation Networks)

“推敲”二字可以认为是来源于人类阅读、写文章以及做其他任务时候的一种行为方式,即任务完成之后,并不当即终止,而是会反复推敲

微软亚洲研究院机器学习组将这个过程沿用到了机器学习中。推敲网络具有两段解码器,其中第一阶段解码器用于解码生成原始序列,第二阶段解码器通过推敲的过程打磨和润色原始语句。后者了解全局信息,在机器翻译中看,它可以基于第一阶段生成的语句,产生更好的翻译结果。

■ 论文 | Deliberation Networks: Sequence Generation Beyond One-Pass Decoding

■ 链接 | https://www.paperweekly.site/papers/1749

■ 作者 | Yingce Xia / Fei Tian / Lijun Wu / Jianxin Lin / Tao Qin / Nenghai Yu / Tie-Yan Liu

△ 推敲网络的解码过程

联合训练(Joint Training)

这个方法可以认为是从源语言到目标语言翻译(Source to Target)的学习与从目标语言到源语言翻译(Target to Source)的学习的结合。

中英翻译和英中翻译都使用初始并行数据来训练,在每次训练的迭代过程中,中英翻译系统将中文句子翻译成英文句子,从而获得新的句对,而该句对又可以反过来补充到英中翻译系统的数据集中。

同理,这个过程也可以反向进行。这样双向融合不仅使得两个系统的训练数据集大大增加,而且准确率也大幅提高

■ 论文 | Joint Training for Neural Machine Translation Models with Monolingual Data

■ 链接 | https://www.paperweekly.site/papers/1750

■ 作者 | Zhirui Zhang / Shujie Liu / Mu Li / Ming Zhou / Enhong Chen

△ 联合训练:从源语言到目标语言翻译(Source to Target)P(y|x) 与从目标语言到源语言翻译(Target to Source)P(x|y)

一致性规范(Agreement Regularization)

翻译结果可以从左到右按顺序产生,也可以从右到左进行生成。该规范对从左到右和从右到左的翻译结果进行约束。如果这两个过程生成的翻译结果一样,一般而言比结果不一样的翻译更加可信。这个约束,应用于神经机器翻译训练过程中,以鼓励系统基于这两个相反的过程生成一致的翻译结果

■ 论文 | Achieving Human Parity on Automatic Chinese to English News Translation

■ 链接 | https://www.paperweekly.site/papers/1751

■ 作者 | Hany Hassan / Anthony Aue / Chang Chen / Vishal Chowdhary 等

试用系统:

https://translator.microsoft.com/neural/

微软翻译工具Microsoft Translator: 

https://www.microsoft.com/en-us/translator/default.aspx

点击以下标题查看相关内容:

  • 非自回归神经机器翻译 + ICLR 2018 论文解读

  • 腾讯AI Lab涂兆鹏:如何提升神经网络翻译的忠实度

#榜 单 公 布 #


2017年度最值得读的AI论文 | NLP篇 · 评选结果公布

2017年度最值得读的AI论文 | CV篇 · 评选结果公布

  我是彩蛋 


解锁新功能:热门职位推荐!

PaperWeekly小程序升级啦

今日arXiv√猜你喜欢√热门职位

找全职找实习都不是问题

 解锁方式 

1. 识别下方二维码打开小程序

2. 用PaperWeekly社区账号进行登陆

3. 登陆后即可解锁所有功能

 职位发布 

请添加小助手微信(pwbot01)进行咨询

长按识别二维码,使用小程序

*点击阅读原文即可注册


关于PaperWeekly


PaperWeekly 是一个推荐、解读、讨论、报道人工智能前沿论文成果的学术平台。如果你研究或从事 AI 领域,欢迎在公众号后台点击「交流群」,小助手将把你带入 PaperWeekly 的交流群里。

▽ 点击 | 阅读原文 | 加入社区一起刷论文

微软机器翻译系统:中-英翻译水平可“与人类媲美”相关推荐

  1. AI一分钟 | 腾讯将成立机器人实验室;机器翻译重大突破:中英翻译已达人类水平

    整理 | 阿司匹林 一分钟AI 腾讯AI Lab宣布与施普林格·自然集团旗下的自然科研正式达成战略合作,并宣布即将成立机器人实验室"Robotics X". 微软与雷德蒙研究院研发 ...

  2. 大学英语综合教程二 Unit 4 课文内容英译中 中英翻译

    大学英语综合教程二 Unit 4 课文内容英译中 中英翻译   大家好,我叫亓官劼(qí guān jié ),在CSDN中记录学习的点滴历程,时光荏苒,未来可期,加油~博客地址为:亓官劼的博客 本文 ...

  3. 大学英语综合教程四 Unit 4 课文内容英译中 中英翻译

    大学英语综合教程四 Unit 4 课文内容英译中 中英翻译   大家好,我叫亓官劼(qí guān jié ),在CSDN中记录学习的点滴历程,时光荏苒,未来可期,加油~博客地址为:亓官劼的博客 本文 ...

  4. 微信公众平台消息接口开发(3)中英翻译

    微信公众平台开发模式 微信 平台 消息 接口 英语翻译 互译   作者:http://www.cnblogs.com/txw1958/ 标题http://www.cnblogs.com/txw1958 ...

  5. 中英翻译机c语言实验报告引言,课程设计--C语言关键字中英翻译机.doc

    课程设计--C语言关键字中英翻译机.doc 课 程 设 计 报 告学院.系 吉林大学珠海学院计算机科学与技术系专业名称 计算机科学与技术课程设计科目 C 语言程序课程设计所在班级 4 班学生学号 04 ...

  6. 大学英语综合教程一 Unit 8 课文内容英译中 中英翻译

    大学英语综合教程一 Unit 8 课文内容英译中 中英翻译   大家好,我叫亓官劼(qí guān jié ),在CSDN中记录学习的点滴历程,时光荏苒,未来可期,加油~博客地址为:亓官劼的博客 本文 ...

  7. 大学英语综合教程二 Unit 5 课文内容英译中 中英翻译

    大学英语综合教程二 Unit 5 课文内容英译中 中英翻译   大家好,我叫亓官劼(qí guān jié ),在CSDN中记录学习的点滴历程,时光荏苒,未来可期,加油~博客地址为:亓官劼的博客 本文 ...

  8. 大学英语综合教程三 Unit 6 课文内容英译中 中英翻译

    大学英语综合教程三 Unit 6 课文内容英译中 中英翻译   大家好,我叫亓官劼(qí guān jié ),在CSDN中记录学习的点滴历程,时光荏苒,未来可期,加油~博客地址为:亓官劼的博客 本文 ...

  9. 大学英语综合教程一 Unit 2 课文内容英译中 中英翻译

    大学英语综合教程一 Unit 2 课文内容英译中 中英翻译   大家好,我叫亓官劼(qí guān jié ),在CSDN中记录学习的点滴历程,时光荏苒,未来可期,加油~博客地址为:亓官劼的博客 本文 ...

最新文章

  1. 打造政产学研新型研发机构 加速人工智能科研成果转化
  2. Linux JQ 命令学习笔记
  3. 放置奇兵 算法 月度活动 破碎时空记录 第七关 阿姨(阿伊达)+暗战(阿斯布)
  4. [树形dp] Jzoj P1046 寻宝之旅
  5. linux系统日志_如何使用 Linux Cockpit 来管理系统性能 | Linux 中国
  6. 对象池回收对象_回收对象以提高性能
  7. 视觉SLAM笔记(36) 3D-2D: PnP
  8. 梯度下降、随机梯度下降、方差减小的梯度下降(matlab实现)
  9. sql 计算单行数据字段空值比例_如何利用工具,迅猛定位低效SQL? | 1分钟系列...
  10. qnap raid5升级raid6_QNAP TS-419P组建RAID5后重建Transmission!
  11. lopatkin俄大神精简中文系统Windows 10 Pro 19041.21 20H1 Release x86-x64 ZH-CN SMS
  12. OPPO Enco X无线降噪耳机体验评测,加钱变强!
  13. 帆软BI日期函数总结
  14. Nature子刊:识别偏头痛脑与遗传的标志物
  15. java开发工具(3)你真的会用IDEA么?(下)keyMap、Project Structure功能介绍
  16. NDK学习笔记:FFmpeg解压MP34提取音频PCM(swrContext、swr_alloc_set_opts)
  17. Linux ——Shell编程---以后补全
  18. 新版H5神偷农场游戏系统
  19. QPluginLoader 加载插件dll失败
  20. 2021-10-20-Flask-02 路由与参数解析

热门文章

  1. 安卓dj专业打碟机软件_用手机打碟的DJ趴是什么水平?
  2. MICROSOFT EXCEL DRIVER未发现数据源名称并且未指定默认驱动程序
  3. 计算机组装模拟系统吗,有模拟组装电脑配置单是什么APP软件?
  4. 信息安全工程师笔记-工控安全需求分析与安全保护工程
  5. 数据库篇之InnoDB存储引擎
  6. pytracking框架 服务器端配置采坑(ubuntu18.04+cuda11.3)
  7. MAC vim 每次打开报错 E1208: -complete used without allowing argumentsError
  8. 为什么软件开发周期总是预估的2-3倍
  9. 输出安全能力 护航数字福建|安全狗全力支撑福建省多个单位部门2021年工作开展
  10. VMware16的安装以及VMware安装Linux(CentOS7)虚拟机教程(超详细)