https://mp.weixin.qq.com/s?src=11&timestamp=1549622157&ver=1416&signature=XNO*cJ7y9wjUdZCp*A7-vjLaDRvFlNx7E5bnRX2yT6BWMkuQRDRSmuh7QFtRisLYCMviNIUWy9UBGtuiaOzjBE96vbWEjwcbZGu*id*N8mRPbYkbkaQy6e2XbYmGvniW&new=1

在生产和经济高度全球化的今天,机器翻译(Machine Translation)是人类面对外语时最渴望拥有的工具,也是神经网络带来最大变革的人工智能问题之一。

从最早的基于规则的机器翻译,到基于概率的机器翻译,再到现在的基于神经网络的机器翻译,机器学习和语言学的研究人员们一起经历了几十年的历程。如今的机器翻译系统虽然还算不上尽善尽美,但以谷歌翻译、百度翻译为代表的,使用神经机器翻译技术的大规模开放使用的翻译系统,已经可以时不时地给出一些流畅、明了的双语互译结果了。

当然了,在神经网络/深度学习的冲击之下,我们也不免看到这样的调侃:“团队里每开除一个语言学家,翻译模型的准确率就可以再提升一点。”在越来越大的语料库、越来越多的模型设计和训练技巧的帮助下,来自语言学领域的指导带来的提升远不如机器学习领域的新技术成果、甚至已有技术成果的好的实现带来的提升大。AI 科技评论的读者们相信也有这样的感觉。

机器翻译,尤其是神经机器翻译(neural machine translation,NMT)也是清华大学自然语言处理与社会人文计算实验室重点关注的研究课题之一。为了便于自己研究,也给这个课题的其他研究人员提供从那靠和指引,清华大学自然语言处理与社会人文计算实验室机器翻译小组在 GitHub 上维护着一份神经机器翻译论文清单,包含了这个领域内他们认为起到重要作用的研究论文。

列表中的神经机器翻译论文划分为了模型架构、注意力机制、开放词库、训练目标、解码、低语言资源翻译、先验知识集成、文档级别翻译、鲁棒性、可视化和可解释性、语言学解释、公平性和多样性、效率、语音翻译、多模态、集成和重新排序、预训练、领域适应、质量估计、以人为中心的神经机器翻译、单词翻译及双语专用语翻译、诗歌翻译等主题,内容十分全面细致。除此之外,他们也列出了 10 篇必读论文。

这 10 篇必读论文是:

  • Peter E. Brown, Stephen A. Della Pietra, Vincent J. Della Pietra, and Robert L. Mercer. 1993. The Mathematics of Statistical Machine Translation: Parameter Estimation. Computational Linguistics. (Citation: 4,965)

  • Kishore Papineni, Salim Roukos, Todd Ward, and Wei-Jing Zhu. 2002. BLEU: a Method for Automatic Evaluation of Machine Translation. In Proceedings of ACL 2002. (Citation: 8,507)

  • Philipp Koehn, Franz J. Och, and Daniel Marcu. 2003. Statistical Phrase-Based Translation. In Proceedings of NAACL 2003. (Citation: 3,514)

  • Franz Josef Och. 2003. Minimum Error Rate Training in Statistical Machine Translation. In Proceedings of ACL 2003. (Citation: 2,982)

  • David Chiang. 2007. Hierarchical Phrase-Based Translation. Computational Linguistics. (Citation: 1,192)

  • Ilya Sutskever, Oriol Vinyals, and Quoc V. Le. 2014. Sequence to Sequence Learning with Neural Networks. In Proceedings of NIPS 2014. (Citation: 5,428)

  • Dzmitry Bahdanau, Kyunghyun Cho, and Yoshua Bengio. 2015. Neural Machine Translation by Jointly Learning to Align and Translate. In Proceedings of ICLR 2015. (Citation: 5,572)

  • Diederik P. Kingma, Jimmy Ba. 2015. Adam: A Method for Stochastic Optimization. In Proceedings of ICLR 2015. (Citation: 16,572)

  • Rico Sennrich, Barry Haddow, and Alexandra Birch. 2016. Neural Machine Translation of Rare Words with Subword Units. In Proceedings of ACL 2016. (Citation: 789)

  • Ashish Vaswani, Noam Shazeer, Niki Parmar, Jakob Uszkoreit, Llion Jones, Aidan N. Gomez, Lukasz Kaiser, and Illia Polosukhin. 2017. Attention is All You Need. In Proceedings of NIPS 2017. (Citation: 1,047)

论文列表具体内容请见:https://github.com/THUNLP-MT/MT-Reading-List

另外,在清华大学自然语言处理与社会人文计算实验室机器翻译小组的 GitHub 页面还可以看到他们的开源神经机器翻译工具包 THUMT (https://github.com/THUNLP-MT/THUMT )。

学界 | 和清华大学自然语言处理与社会人文计算实验室一起读机器翻译论文相关推荐

  1. 清华大学人工智能研究院自然语言处理与社会人文计算研究中心成立,重磅推出两场前沿学术报告和三项特色开源成果...

    来源:TsinghuaNLP 2019年7月1日,清华大学人工智能研究院自然语言处理与社会人文计算研究中心(以下简称中心)成立仪式在清华大学FIT楼举行.清华大学副校长.清华大学人工智能研究院管委会主 ...

  2. 清华大学人工智能研究院成立自然语言处理与社会人文计算研究中心

    2019年7月1日,清华大学人工智能研究院自然语言处理与社会人文计算研究中心(以下简称中心)成立仪式在清华大学FIT楼举行.清华大学副校长.清华大学人工智能研究院管委会主任尤政院士,清华大学人工智能研 ...

  3. 史上最大的实体关系抽取数据集!清华大学自然语言处理团队发布 FewRel...

    雷锋网 AI 科技评论按,在去年的 EMNLP2018 上,清华大学自然语言处理实验室发布了一个大规模精标注关系抽取数据集 FewRel.据了解,这是目前最大的精标注关系抽取数据集. 据清华大学自然语 ...

  4. 【NLP】6 gensim word2vec基于中文语料库实战——中文wiki百科、清华大学自然语言处理实验室数据集、搜狗全网新闻数据集

    gensim word2vec自己寻找语料库训练模型--非gensim data 1. 数据下载 2. 中文wiki百科 2.1 数据获取 2.2 数据处理 3. 清华大学自然语言处理实验室数据集 4 ...

  5. 社会人文跨计算机考研,各位跨专业考研党,不要违反这个规则,不然结果会让人遗憾...

    原标题:各位跨专业考研党,不要违反这个规则,不然结果会让人遗憾 学有方法,考有技巧,优学优考策略致力于学与考的最优结合,助力学子考入理想大学! 跨专业考研的原因多种多样,大多都是不喜欢本科期间学习的专 ...

  6. 瞄准自然语言处理,百度与鹏城实验室共建实验室

    4月16日,百度与鹏城"自然语言处理联合实验室"签约暨揭牌仪式在鹏城实验室举行. 中国工程院院士.鹏城实验室主任高文出席仪式并致辞,鹏城实验室人工智能研究中心主任李革教授和百度集团 ...

  7. 【读点论文】Transformer in Transformer 细化图片结构,递归使用transformer。让图片去拟合自然语言处理的操作。

    Transformer in Transformer Abstract Transformer是一种新的神经架构,它通过注意机制将输入数据编码为强大的特征.基本上,视觉transformer首先将输入 ...

  8. 【自然语言处理】对评论进行处理的推荐系统的论文总结

    [自然语言处理]对评论进行处理的推荐系统的论文总结 NLP语料库介绍的以及连接 腾讯语料库 github上40个nlp中文语料库 推荐系统中常见的文本处理方法 词袋模型 BOW 推荐系统中的应用 存在 ...

  9. 【社会/人文】概念的理解 —— 断舍离、饭(饭制版)

    断舍离是日本杂物管理咨询师山下英子提出的概念: 断:不买.不收取不需要的东西: 断是拒绝: 舍:处理掉堆放在家里没用的东西: 抛弃存量: 离:舍弃对物质的迷恋,让自己处于宽敞舒适,自由自在的空间: 离 ...

最新文章

  1. 【Linux】一步一步学Linux——who命令(95)
  2. 美国读本科出勤率低被休学,无法毕业怎么办
  3. c程序设计语言选修难吗,欢迎大家选修C语言程序设计这门课,本帖解释一下一些常见的问题...
  4. mysql or_MySQL中or语句用法示例
  5. wireshark全网过虑最全规则
  6. JVM学习-StringTable字符串常量池
  7. 数值分析(第五版) 第一章知识点总结
  8. 根据中心点、半径长度和角度画点
  9. 参考文献起止页码怎么写_参考文献起止页码格式
  10. 解密Google Deepmind AlphaGo围棋算法
  11. html支持bmp格式,bmp和jpg的区别是什么?
  12. Android~adb卸载系统预装应用(亲测有效)
  13. 嵌入式的苦逼从何而来
  14. HIVE:Hive启动 beeline 客户端失败的解决方法
  15. js 无害化_道德第一无害
  16. 收藏张老三的NHibernate 博客园专题之一
  17. Render函数的用法
  18. 金山办公和金山软件是同一家公司?复盘金山办公成长史 | 云计算
  19. ko 绑定html,WeX5的正确打开方式(3)——绑定机制
  20. RHCSA操作第四次作业

热门文章

  1. stackoverflow提问网站(why prefer generator to list)
  2. 韩磊老师与C#编程风格
  3. 使用ROS和TensorFlow进行深度学习
  4. 独家 | Python处理海量数据集的三种方法
  5. 基于跨国人口流动数据的新冠病毒传播途径分析
  6. 独家 | R语言中K邻近算法的初学者指南:从菜鸟到大神(附代码&链接)
  7. 2017年度NLP领域论文TOP10(附链接)
  8. 台大喊你来上课,深度学习优化,免费的哟
  9. 祝贺!又一批清华大学长聘教授,来了!
  10. 腾讯1.5亿元「科学探索奖」开奖,北大夺冠,更有28岁美女博导获奖