本文经AI新媒体量子位(公众号ID:qbitai)授权转载,转载请联系出处。

本文约2500字,建议阅读5分钟。

本文为你介绍了百度于硅谷宣布了最新重大突破——一个名为STACL的同传AI的情况。

同传AI,刚刚在国内掀起过暴风骤雨。

但现在,百度于硅谷宣布了最新重大突破——一个名为STACL的同传AI,论文结果优异,Demo效果惊人。

MIT科技评论、IEEE Spectrum等一众外媒,还纷纷给出好评,这是2016年百度Deep Speech 2发布以来,又一项让技术外媒们如此激动的新进展。

百度自己披露:与现在大多数AI“实时”翻译系统不同,STACL的特点是能预测延时可控,能够在演讲者讲话后几秒钟开始翻译,并在句子结束后几秒钟内完成。

STACL不走“整句说完再翻译”的路线,甚至还会预测发言者未来几秒的内容,于是延时更短,更接近人类同传。

究竟能达到什么程度?IEEE Spectrum采访后给出类比:跟联合国会议里的人类同传相媲美。

实际效果果真如此?那突破显然重大。

Demo展示:翻译AI会预测


视频时长13S,建议WIFI条件下观看

Demo可以看出,百度STACL的翻译工作延时非常短,与原句只差几个字。

虽说这个AI目前只是同步翻译成文字,还没有合成译文的语音,但这不是重点。关键是,不知道你有没有注意到,这种“只差几个字”有多难得。

还没等“美国总统布什在莫斯科与俄罗斯总统普京在莫斯科会晤。”这句汉语说到莫斯科,自动翻译的英语已经出现了“meet”,也就是汉语句末的“会晤”。

这个“meet”,是AI从前半句话里脑补出来的,依据的是美国总统最可能与其他人发生怎样的活动。

因此,百度这个同传AI,不用等一句话说完,就能开始翻译了。

对于翻译AI来说,预测是一项很罕见的技能。不同语言的语序总有差异,所以,那些没有预测能力的翻译AI,通常需要等到人类讲完一句话,再开始翻译。

再举一个栗子 (下图) ,从“百度在18年前”这半句里,AI预测出了百度创立的内容“started a business”。

那么,科学地讲,百度AI的预测效果到底怎么样?

衡量翻译质量,要看BLEU分。

中译英延后5个字的情况下,比起传统的整句翻译AI,百度的BLEU分要低了3.4分。

毕竟是预测,发生错误是自然的。而这个差距在百度看来是可以接受的。

比如,百度AI可能从前半句话里预测出会面顺利进行,而事实可能是会面并不顺利。翻译就容易出现失误。

面对这样的情况,AI目前并没有纠错的能力。

不过,用小小的延时,就可以换取更高的准确度:如从延3个词到延5个词。用户可以根据需求随意调整。

中英语序相似

而当两种语言语序相差不多的时候,例如描述戴安娜王妃车祸事件的新闻,STACL和传统整句翻译的成绩相比,就没有明显差异了。

这种预测能力,是哪来的?

答案是一个名叫wait-k的模型,它把预测和翻译无缝整合到了一起,百度把它和两个翻译模型结合起来做了实验,一个是比较早期的RNN翻译模型,另一个是Google在2017年推出即大热的Transformer。

不过,wait-k不仅仅适用于这两个模型,而是可以用在任何序列映射(sequence-to-sequence)模型上。也就是说,只要有个模型能搞定两种语言之间的翻译,加上这个wait-k做一点小改造,就能实现同传了。

一个机器翻译系统,离不开分析输入语言的编码器和输出目标语言的解码器,而wait-k对机器翻译模型所做的小改动,就在解码器上。它让解码器在输出内容的同时,能预测编码器还没有输入的东西。

百度用这样一个公式描述了这种解码策略:

其中,x代表输入的内容,y代表输出,t代表时间步,而k表示的是解码器比编码器抢跑的词数。

技术细节在论文STACL: Simultaneous Translation with Integrated Anticipation and Controllable Latency中有详细的介绍。

地址:

https://arxiv.org/abs/1810.08398

团队介绍

By the way,按署名次序,介绍一下9位论文作者。

Mingbo Ma,百度硅谷AI实验室科学家,拥有三个学校的计算机博士学位,今年8月刚从俄勒冈州立大学博士毕业,另外两个学位在美国东北大学和纽约城市大学,本科毕业于吉林大学,此前曾在苹果和IBM实习。

黄亮,俄勒冈州立大学助理教授,百度美研首席科学家,此前曾就职于IBM和谷歌,并在纽约城市大学、南加州大学担任过助理教授,博士毕业于宾夕法尼亚大学。

Hao Xiong,爱丁堡大学计算机硕士,本科毕业于河海大学,2015年加入百度任软件工程师,负责大容量数据处理系统和资源调度系统。

Kaibo Liu,俄勒冈州立大学助理研究员,今年6月刚到百度实习,本科毕业于北大。

Chuanqiang Zhang,低调的百度技术员工,目前无更多资料。

何中军,百度主任架构师,从事机器翻译研究与开发十余年,多篇论文发表在本领域权威国际会议ACL、EMNLP、COLING、AAAI等,参与项目曾获2015年度国家科学技术进步奖二等奖。

Hairong Liu,百度硅谷AI实验室科学家,曾就职于三星和普渡大学,华中科大电子电气博士。

Xing Li,中科院自然语言处理和机器学习硕士,百度硅谷人工智能实验室的高级经理,曾任英特尔技术leader,在百度担任过技术工程经理,领导百度贴吧研发团队。

王海峰,百度高级副总裁,e-Staff,百度AIG负责人、百度研究院院长,哈工大计算机博士。

王海峰

第一波评价

百度这次技术突破宣布后,首先在外媒引发报道。

有好评。其中评价最高的是IEEE Spectrum,认为百度开发的这个新系统,揭示了一种通过预测未来而保持稳定的翻译工具,可以与联合国会议期间提供同传服务的口译人员相媲美,让人们离软件巴别鱼又近了一步。

有对比。比如将百度的这次突破与谷歌联系起来。南华早报评论:随着百度新的翻译系统亮相,百度向谷歌发起了挑战。

还有将百度和谷歌放一起当“耦合”的。Engadget观点:

虽然这个系统仍旧有局限性,而且无法在必要的时候取代人类翻译。但是它在谷歌缺席中国的情况下,给出了一种新的选择。

SiliconANGLE则援引分析师评论称:“亚洲的语言翻译方面仍然存在一定的局限性,看到本地的玩家加入到这个游戏中来,的确是一件好事。”

但目前最多的态度是观望。

在技术宅密度比较高的Hacker News和Reddit上,百度的这条消息,并没有引发太多的讨论。

截至早上7点40分,Reddit只有一条评论,Hacker News上有两条评论——虽然这个消息发布已有5个多小时。

Reddit上面的一条评论有点“水”,只是说这个Demo很好。

Hacker News的两条评论中,一条比较有技术含量,提出了如何翻译德语的问题,并给出了一些示例,另一条是说,这个Demo很好。

比较有趣的是,两个说这个Demo很好的网友,昵称基本上是一样的。

不过这个技术到底好不好,更多中外关注者马上都能给出判断。

因为百度最快会在下周的年度技术大会上,进行公开展示。

究竟是重大突破,抑或还只是完美Demo,到时一看便知。

当然,有科研实力有技术复现的同学,现在就能去试试了。

欢迎反馈你的测后评价~

— 完 —

AI同传最新突破:能预测,低延时,外媒称媲美人类翻译相关推荐

  1. 百度宣布AI同传最新突破!能预测,低延时,演示效果惊人,外媒称媲美人类翻译...

    夏乙 栗子 乾明 一璞 发自 三区五地  量子位 报道 | 公众号 QbitAI 同传AI,刚刚在国内掀起过暴风骤雨. 但现在,百度于硅谷宣布了最新重大突破--一个名为STACL的同传AI,论文结果优 ...

  2. AI遮天传 DL-回归与分类

    本文主要介绍Logistic回归和Softmax回归 一.回归与分类回忆 给定数据点集合  和相应的标签 ,对于一个新的数据点x,预测它的标签(目标是找到一个映射 ): 如果是一个连续的集合,称其为回 ...

  3. 清流鼎点发布超低延时技术,50ms超低延时赋能多行业强交互场景丨Xtecher 前线

    网址|www.xtecher.com 微信公众号ID|Xtecher "我们做的是小而精的硅谷式公司,使命是用技术改变世界",清流鼎点(PowerInfo)CEO要文涛如此强调该公 ...

  4. 腾讯云低延时直播系统架构设计与弱网优化实践

    "直播带货"可能是2020年最具代表性的词汇之一,那么传统电商该如何融合直播系统,直播过程如何保障用户的最佳观看体验?本文由腾讯云资深架构师何书照在LiveVideoStack线上 ...

  5. 腾讯云联合信通院发布《超低延时直播白皮书》,推动直播延时降低90%以上

    直播行业的蓬勃发展,推动直播技术的快速演进. 2月22日,腾讯云携手信通院联合发布<超低延时直播白皮书>.在白皮书中指出,随着越来越多线上业务需要大规模并发支持以及强互动体验,超低延时必将 ...

  6. 百度新突破:AI同声传译系统STACL,可预测,低延迟

    文章来源:ATYUN AI平台 百度开发了新的AI系统,名为同声传译和预期与可控延迟(STACL),百度声称这代表了自然语言处理的重大突破. 与大多数AI翻译系统不同,STACL能够在演讲者讲话后几秒 ...

  7. AI同传效果媲美人类,百度翻译出品全球首个上下文感知机器同传模型

    鱼羊 发自 凹非寺  量子位 报道 | 公众号 QbitAI AI同传领域又有新进展,这次突破来自百度. 百度机器翻译团队创新性地提出了全球首个感知上下文的机器同传模型,并基于此发布了最新的语音到语音 ...

  8. 【深度学习】一文看尽深度学习各领域最新突破

    来源:<产业智能官> 想要了解深度学习各领域的最新进展? 看个视频就足矣. 该课程的PPT资料,下载地址如下: https://www.dropbox.com/s/v3rq3895r05x ...

  9. AI同传变革性进展:搜狗同传3.0首创语境引擎,让机器具有理解、推理能力

    [导读]近日,在极客公园大会上,搜狗同传最新版本 3.0 首次正式亮相.自 2016 年推出业内首个商用机器同传产品以来,经过数次迭代,搜狗同传 3.0 同样以业内首个"多模态"同 ...

最新文章

  1. 将文件名和文件修改时间批量输出至Excel中
  2. BZOJ2208:[JSOI2010]连通数——题解
  3. python【数据结构与算法】搜索初探
  4. fseek/ftell/rewind/fgetpos/fsetpos函数使用-linux
  5. 【机器学习】关联规则代码练习
  6. 数据仓库—数据仓库—Sybase IQ 介绍
  7. 你应该需要知道的前端小技巧
  8. 若依前后端分离版本如何使用Swagger
  9. Linux 设备模型
  10. 排除包_冷水机压缩机压缩机常见故障和排除方法
  11. php smarty配置,PHP中使用Smarty模板目录结构配置
  12. SQLSERVER Agent服务无法启动
  13. 物品分类游戏html5,物品的用途分类教案
  14. HTML标签----图文详解
  15. Bash 单行注释与多行注释
  16. 数据库(MySQL)基础
  17. windows系统可以用android,如何在电脑上使用Android系统?
  18. LTE default bearer dedicated bearer and radio bearer
  19. 两级分销加两级代理佣金计算工具
  20. CAN 网络故障诊断

热门文章

  1. 【TK】1011: 软件版本
  2. 如何查找jdk安装目录
  3. 隔墙有耳的观察者模式(Observer Patern)
  4. linux内核网络驱动框架(linux驱动开发篇)
  5. Python-Django毕业设计行程规划app(程序+Lw)
  6. 【Matlab行为识别】差影法三维人体姿态行为识别【含源码 277期】
  7. 可用软硬件技术来检测与消除计算机病毒,重庆计算机一模级拟试题.doc
  8. 混沌的市场里,怎么一眼识别出「好房子」
  9. 死磕Java集合之BitSet源码分析(JDK18)
  10. 史上最详细宝塔面板安装教程(收藏)