每天给你送来NLP技术干货!


2022年7月,Meta(原Facebook)AI 发布了一个大规模机器翻译模型NLLB-200,该模型在神经网络架构上混合了稠密和稀疏神经网络,参数规模达545亿,在覆盖202种语言、2440个语向的180亿平行句对上进行训练,训练后的单一模型可支持所有覆盖语言之间的的自动翻译(即202X201=40602个语向的互译)。

该模型的名字是英文No Language Left Behind的缩写,体现了机器翻译实现世界上所有语言互译的美好愿景。

历经70载,机器翻译进入深度学习驱动时代

机器翻译诞生于二十世纪四五十年代,纵观机器翻译70多年的发展历程,从最初的朴素统计模式,发展到基于规则的机器翻译、统计机器翻译,再到目前的深度学习驱动的神经机器翻译,不同技术范式在不同历史时期各领风骚。

(图源:https://acutrans.com/top-10-most-commonly-spoken-languages-in-the-world/)

目前机器翻译的主流技术范式——神经机器翻译——是一种基于神经网络的端到端机器翻译模式。区别于前代的统计机器翻译采用的多步骤级联方式,神经机器翻译只需要输入源语言句子,就能直接输出目标语言序列。

如下图所示,其基本思想是利用神经网络对源语言进行编码得到源语言的语义表示,然后根据该语义表示解码生成目标语言。这种端到端模式使模型可以一次性整体训练,既避免了传统级联方式的错误传递,也大大降低了模型训练和部署的烦琐程度。

(来自书中图4.1:神经机器翻译结构示例)

时至今日,神经机器翻译已成为在线机器翻译的主要引擎,每天以数千亿单词量的翻译规模服务全世界各地用户。

但即便如此,机器翻译仍然存在诸多挑战和难题。

一方面,全世界在使用的语言有几千种,即使像NLLB这样的大规模模型,目前也只能覆盖200余种语言,占比不到已有语言的1/30,大量语言在机器翻译版图里仍然被“Left Behind”。

另一方面,神经机器翻译虽然显著提升了译文质量,但仍然面临鲁棒性、可解释性、广域语境依赖性、多模态、资源稀缺等多种挑战和开放问题。

《神经机器翻译:基础、原理、实践与进阶》正是在这样的背景中写就的。

“百科全书”式内容,展现神经机器翻译全景视图

该书为实践者总结已有技术,为研究者梳理前沿进展,并站在机器翻译历史发展的角度,对比不同机器翻译范式,希望读者能从对比中窥见技术发展的内在原因和规律,以此吸引更多机器翻译爱好者为实现所有语言互译的美好愿景添砖加瓦。

全书分为基础篇、原理篇、实践篇和进阶篇,覆盖神经机器翻译的基础知识、经典框架、原理技术、实践方法与技巧,以及无监督神经机器翻译、多语言神经机器翻译、语音与视觉多模态机器翻译等前沿研究方向。

全书理论与实践相结合,基础与前沿相交映。

技术与短评双主线叙事,不止于技术

除此之外,本书的一个特色是在每一章均附有一篇短评,针对相应章节的主题,介绍和评论神经机器翻译技术背后的历史、故事、思想、哲学、争议和规范等。短评与全书内容相交错,使读者对神经机器翻译技术不仅知其然,而且知其所以然。

适读人群

本书适合高等院校计算机专业高年级本科生,以及人工智能、自然语言处理方向的研究生阅读,也可供机器翻译研究者、实践者、使用者,以及机器翻译行业的管理者、人工翻译研究人员等对机器翻译技术感兴趣的读者参考。

作者介绍

熊德意

天津大学智能与计算学部教授、博士生导师、自然语言处理实验室负责人,天津大学“语言智能与技术”中外联合研究中心主任,中译语通-天津大学自然语言处理联合实验室主任、中译语通人工智能首席科学家。

主要研究方向为自然语言处理,特别专注于机器翻译、对话、问答、自然语言生成、常识推理、认知计算等方向的研究。在Computational Linguistics、IEEE TPAMI、AI、AAAI、ACL等国际著名期刊和会议上发表论文100余篇,在Springer出版英文专著一部。

获得国家自然科学基金优秀青年科学基金、国家重点研发计划“政府间国际科技合作创新合作”重点专项、英国皇家学会牛顿高级学者基金等资助。

获得新加坡资讯通信研究院2008年年度研究贡献奖、北京市科学技术奖二等奖、中文信息学会“钱伟长中文信息处理科学技术奖-汉王青年创新奖”一等奖等奖项。

曾是亚洲自然语言处理联合会AFNLP干事、新加坡中文与东方语文信息处理学会理事会成员,目前是中国中文信息学会理事。担任IALP 2012&2021程序委员会共同主席,CWMT 2017程序委员会共同主席,欧盟多国联合项目QTLeap咨询专家,ACL、EMNLP、NAACL、COLING等多个知名国际会议领域主席,以及TACL和ARR的Action Editor等。

李良友

华为诺亚方舟实验室研究员、机器翻译团队负责人。在欧盟玛丽居里项目资助下,于2017年获得都柏林城市大学计算机博士学位。

主要研究方向为自然语言处理,特别专注于机器翻译相关技术领域的研发。在ACL、EMNLP等多个国际著名会议和期刊上发表论文10余篇,并担任ACL、EMNLP等国际会议领域主席和会议审稿人。

张檬

华为诺亚方舟实验室研究员。于2018年获得清华大学计算机科学与技术系博士学位。

主要研究方向为机器翻译和跨语言自然语言处理。在ACL、EMNLP、AAAI、TASLP等国际著名会议和期刊上发表论文10余篇。

曾获中国中文信息学会优秀博士学位论文提名奖。担任ACL、EMNLP、AAAI、IJCAI等多个知名国际会议审稿人。

粉丝专享六折优惠

感兴趣的小伙伴可以扫码或点击阅读原文

文末认真留言,点赞前4名送该书 (价值100+元)

截止时间:2022.8.21 晚8:00


【赠书】熊德意老师的一部不止于技术的神经机器翻译“百科全书”相关推荐

  1. 【赠书】重磅神经机器翻译“百科全书”,你想学习的机器翻译内容,都在这里...

    ‍‍ 机器翻译诞生于二十世纪四五十年代,纵观机器翻译70多年的发展历程,从最初的朴素统计模式,发展到基于规则的机器翻译.统计机器翻译,再到目前的深度学习驱动的神经机器翻译,不同技术范式在不同历史时期各 ...

  2. 人工智能,不止于技术的革命--WOT2017全球创新技术峰会开幕

    作为一门学科,人工智能(AI)于1956年问世,历经一个甲子,几度沉浮.随着新一轮产业变革席卷全球,人工智能成为新一轮产业变革的核心方向.如今,人工智能已经无处不在,无人驾驶.金融.医疗.教育等等,只 ...

  3. lightroom 闪退_子意老师Lightroom从入门到精通系统课程

    Lightroom入门到精通提升图片处理的速度摄影师必备修图效率工具 9月我们又将迎来开学季,正是学习听课的好日子~新的学年,大家好呀!近期看到很多影友留言说,能不能开设Lightroom这款修图软件 ...

  4. 面向对象之继承,抽象,接口的案例(刘意老师的猫狗案例)

    猫狗案例,加入跳高的额外功能 分析:从具体到抽象 猫: 姓名,年龄 吃饭睡觉 狗: 姓名,年龄 吃饭睡觉 由于有共性功能.所以我们抽取出一个父类: 动物: 姓名,年龄 吃饭(); 睡觉(){} 猫:继 ...

  5. 【学术相关】作者解读ICML接收论文:如何使用不止一个数据集训练神经网络模型?...

    作者:欧明锋,浙江大学 导读:在实际的深度学习项目中,难免遇到多个相似数据集,这时一次仅用单个数据集训练模型,难免造成局限.是否存在利用多个数据集训练的可能性?本文带来解读. 01 介绍 迄今为止,在 ...

  6. 南航计算机科学与技术学院老师,关于南航计算机科学与技术学院第七期科创基金项目教师课题征集的通知...

    尊敬的学院教师: 您好! 为了提升学生的专业实践和创新能力,我院为学生搭建了大学生科技创新基金项目实践平台,每年由专业教师发布实践课题供学生申报,并划拨专项经费予以支持.为进一步加强师生互动,让学生更 ...

  7. 意法半导体MCU微控制器技术突破在哪?

    华为5月中旬首次向上汽的量产车型EUNIQ系列供应电机控制器,引起汽车电子行业人士高度关注.华为提供的电机控制器,可以3%的高精度调整电机扭矩和输出控制.经过上汽MAXUS与华为的联合调教,EUNIQ ...

  8. 复旦大学肖仰华老师-知识图谱-概念与技术

    知识图谱( Knowledge Graph)的概念由谷歌2012年正式提出,旨在实现更智能的搜索引擎,并且于2013年以后开始在学术界和业界普及.目前,随着智能信息服务应用的不断发展,知识图谱已被广泛 ...

  9. 杨老师课堂之JavaWeb网站技术架构总结

    题记 有很多学生及一线的开发人员经常会问我到底是什么技术架构,是不是就是目前在学校的SSH.SSM技术,为了让更多的同行对架构这个词汇有更深刻的理解,我分享一下自己的个人见解.从编程开发到IT教学也有 ...

最新文章

  1. 泛型与操作符重载杂谈
  2. Seaborn(1)图画背景刻度设置
  3. 阿里数据库内核月报:2016年03月
  4. 外设驱动库开发笔记13:MLX90614红外温度传感器驱动
  5. 08-Scrum过程-办公环境 每日立会(Standup Meeting)
  6. LeetCode(557)——反转字符串中的单词 III(JavaScript)
  7. Clumsy Keke 三维数组模拟
  8. 如何修改订单金额实现 0.01 元买 iPhone X?
  9. 常用计算机的外部组成设备有哪些,9计算机外部设备..doc
  10. 巧用 Nginx 快速实现 HTTPS 双向认证
  11. Python Day29 网络协议
  12. iptables常用命令
  13. 学生信息管理系统需求文档方案
  14. Android studio 使用阿里巴巴图标矢量图库
  15. Python金融大数据风控建模实战
  16. js通过开始时间和结束时间计算出中间的所有日期
  17. elasticsearch安装插件
  18. 如何低成本,有效地进行企业公众号拉新,获取10万+潜在用户? 黎想
  19. 自签名证书的安装(二)
  20. linux 32 telnet 工具,Telnet/SSH/SSH2终端工具(Zoc terminal)

热门文章

  1. ZCMU--5123: 分糖果(C语言)
  2. perl语言的学习(一)
  3. 当远程连接MySQL数据库的时候显示Can't connect to MySQL server (10060
  4. 校验码 - 奇偶校验
  5. 销量“掉队”,零跑汽车火力全开
  6. 红米android版本,红米note2安卓版本号是多少?红米note2版本介绍
  7. JAVA并发-Future/CompletableFuture
  8. centos 安装 janus
  9. 聊聊消息中心的设计与实现逻辑
  10. java吐泡泡过关,java代码,鱼吐泡泡程序