允中 发自 凹非寺 
量子位 报道 | 公众号 QbitAI

2019年的新年list列了吗?

不如把系统性学习机器翻译加入计划。

而且好消息是,清华大学自然语言处理组(THUNLP),刚刚整理完成了机器翻译阅读清单

这份资源不简单。

首先是。回顾了统计机器翻译(SMT)时代的亮点论文,并概括了近期神经机器翻译(NMT)方向下的各个子领域。

其中包括:

模型架构,注意力机制,开放词表问题与字符级别神经机器翻译,训练准则与框架,解码机制,低资源语言翻译,多语种机器翻译,先验知识融合,文档级别机器翻译,机器翻译中的鲁棒性,可视化与可解释性,公正性与多样性,机器翻译效率问题,语音翻译与同传翻译,多模态翻译,预训练方法,领域适配问题,质量估计,自动后处理,推导双语词典以及诗歌翻译。

其次是系统。有论文,有教程,还有模型。

即便就安安静静当一个伸手党,这份资料也能帮助你不断升级打怪层层进步。

下面,我们转列10大必读论文,更多资料还可通过传送门获得。

10大机器翻译必读论文

Peter E. Brown, Stephen A. Della Pietra, Vincent J. Della Pietra, and Robert L. Mercer. 1993. The Mathematics of Statistical Machine Translation: Parameter Estimation. Computational Linguistics.

http://aclweb.org/anthology/J93-2003

Kishore Papineni, Salim Roukos, Todd Ward, and Wei-Jing Zhu. 2002. BLEU: a Method for Automatic Evaluation of Machine Translation. In Proceedings of ACL 2002.

http://aclweb.org/anthology/P02-1040

Philipp Koehn, Franz J. Och, and Daniel Marcu. 2003. Statistical Phrase-Based Translation. In Proceedings of NAACL 2003.

http://aclweb.org/anthology/N03-1017

Franz Josef Och. 2003. Minimum Error Rate Training in Statistical Machine Translation. In Proceedings of ACL 2003.

http://aclweb.org/anthology/P03-1021

David Chiang. 2007. Hierarchical Phrase-Based Translation. Computational Linguistics.

http://aclweb.org/anthology/J07-2003

Ilya Sutskever, Oriol Vinyals, and Quoc V. Le. 2014. Sequence to Sequence Learning with Neural Networks. In Proceedings of NIPS 2014.

https://papers.nips.cc/paper/5346-sequence-to-sequence-learning-with-neural-networks.pdf

Dzmitry Bahdanau, Kyunghyun Cho, and Yoshua Bengio. 2015. Neural Machine Translation by Jointly Learning to Align and Translate. In Proceedings of ICLR 2015.

https://arxiv.org/pdf/1409.0473.pdf

Diederik P. Kingma, Jimmy Ba. 2015. Adam: A Method for Stochastic Optimization. In Proceedings of ICLR 2015.

https://arxiv.org/pdf/1412.6980.pdf

Rico Sennrich, Barry Haddow, and Alexandra Birch. 2016. Neural Machine Translation of Rare Words with Subword Units. In Proceedings of ACL 2016.

https://arxiv.org/pdf/1508.07909.pdf

Ashish Vaswani, Noam Shazeer, Niki Parmar, Jakob Uszkoreit, Llion Jones, Aidan N. Gomez, Lukasz Kaiser, and Illia Polosukhin. 2017. Attention is All You Need. In Proceedings of NIPS 2017.

https://papers.nips.cc/paper/7181-attention-is-all-you-need.pdf

传送门

十大论文之外,清华大学NLP-MT组完整学习清单:

https://github.com/THUNLP-MT/MT-Reading-List

年度评选报名

加入社群

量子位AI社群开始招募啦,欢迎对AI感兴趣的同学,在量子位公众号(QbitAI)对话界面回复关键字“交流群”,获取入群方式;

此外,量子位专业细分群(自动驾驶、CV、NLP、机器学习等)正在招募,面向正在从事相关领域的工程师及研究人员。

进专业群请在量子位公众号(QbitAI)对话界面回复关键字“专业群”,获取入群方式。(专业群审核较严,敬请谅解)

诚挚招聘

量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复“招聘”两个字。

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

喜欢就点「好看」吧 !

清华大学发布10大机器翻译学习必读论文清单 | 资源相关推荐

  1. 预训练语言模型(PLM)必读论文清单(附论文PDF、源码和模型链接)

    来源:专知 本文约3800字,建议阅读5分钟. 本文介绍清华大学NLP给出的预训练语言模型必读论文清单,包含论文的PDF链接.源码和模型等. [ 导读 ]近两年来,ELMO.BERT等预训练语言模型( ...

  2. 谷歌、阿里们的杀手锏:3大领域,10大深度学习CTR模型演化图谱(附论文)

    来源:知乎 作者:王喆 本文约4000字,建议阅读8分钟. 本文为你介绍近3年来的所有主流深度学习CTR模型. 今天我们一起回顾一下近3年来的所有主流深度学习CTR模型,也是我工作之余的知识总结,希望 ...

  3. 【干货】31篇关于深度学习必读论文汇总(附论文下载地址)

    Kloud Strife在其博客上盘点了最值得关注的有关深度学习的论文,包括架构/模型.生成模型.强化学习.SGD & 优化及理论等各个方面,有些论文名扬四海,有些论文则非常低调.可以根据个人 ...

  4. AlphaGo首席研究员亲授!10张PPT介绍10大强化学习黄金法则!

    来源:新智元 本文共多图,建议阅读10分钟. 为你分享Dave Silver在Deep Learning Indaba活动的主题演讲中归纳出的强化学习中要注意的10大要点. [ 导读 ]近日,谷歌De ...

  5. @即将开学的你,请收好这份必读论文清单

    在碎片化阅读充斥眼球的时代,越来越少的人会去关注每篇论文背后的探索和思考. 在这个栏目里,你会快速 get 每篇精选论文的亮点和痛点,时刻紧跟 AI 前沿成果. 点击本文底部的「阅读原文」即刻加入社区 ...

  6. 10 年深度学习顶级论文和代码精选,请务必收藏!

    点击上方"AI有道",选择"星标"公众号 重磅干货,第一时间送达 你是否经常花费时间或苦于寻找深度学习相关的顶会优秀论文极其相对应的代码?今天给大家介绍一个超赞 ...

  7. Github最受欢迎的10大深度学习时间序列项目

    近几年,随着深度学习的流行,其在时间序列上的应用也越加流行并且在非常多的时间序列预测问题上取得了巨大的突破. 本文我们列举了Github上最受欢迎&关注最多的十大相关的时间序列项目,喜欢的朋友 ...

  8. 【时间序列】Github最受欢迎的10大深度学习时间序列项目!

    作者:杰少 十大时间序列Github仓库 简介 近几年,随着深度学习的流行,其在时间序列上的应用也越加流行并且在非常多的时间序列预测问题上取得了巨大的突破,本文我们列举了Github上最受欢迎& ...

  9. 排序学习-必读论文-AMiner

    AMiner平台由清华大学计算机系研发,拥有我国完全自主知识产权.平台包含了超过2.3亿学术论文/专利和1.36亿学者的科技图谱,提供学者评价.专家发现.智能指派.学术地图等科技情报专业化服务.系统2 ...

最新文章

  1. NVIDIA Jarvis:一个GPU加速对话人工智能应用的框架
  2. 微信小程序 app.json 详细介绍
  3. 【错误记录】生成 Java 文档错误 ( Xxx.java:xx: 错误: 编码GBK的不可映射字符 )
  4. python学习笔记5—数据类型转换
  5. Linux系统安全与应用(二)——安全机制、安全控制、弱口令检测JR、网络扫描NMAP和控制台命令Netstat
  6. Flurl使用Polly实现重试Policy
  7. 船员能力评估计算机软件系统,船舶动力电力训练系统操作水平综合评估算法研究...
  8. python读取xlsx文件pandas_用Python的pandas框架操作Excel文件中的数据教程
  9. java官网门户源码 SSM框架 自适应-响应式 freemarker 静态模版引擎
  10. Python命令行参数
  11. HappyAA服务器部署笔记1(nginx+tomcat的安装与配置)
  12. [原创]group by和compute 的使用
  13. CSDN 勤写标兵勋章 颁发规则
  14. (转载)JavaWeb学习总结(五十二)——使用JavaMail创建邮件和发送邮件
  15. IDEA导入JDK源码
  16. 微信小程序不同类型demo集合含源码
  17. vue展示日历 考勤展示_Vue编写可显示周和月模式的日历 Vue自定义日历内容的显示...
  18. Word操作系列-给方框打钩
  19. 第三方百度地图----显示所在位置
  20. open函数里的newline

热门文章

  1. “可视化”的数据分析落伍了?
  2. Java 9 关注度不断上升!2018 编程语言流行度大调查
  3. 离破产仅一步之遥的A站,还能挺过去吗?
  4. 计算机内部信号表现形式,2021山西特岗教师招聘考试:信息技术学科基础考点归纳六...
  5. 华为手机老是显示不到服务器,老显示连接不到服务器
  6. sqlserver 如何把一列分为一行显示_EXCEL神乎其技 多列追加为一列
  7. java web容器_java-实现一个简单的java Web容器
  8. 自己构建React项目
  9. linux设置不同地址,ubuntu20.04设置静态ip地址(包括不同版本)
  10. linux命令中info,Linux中zipinfo命令起什么作用呢?