神经网络机器翻译 (NMT) 已成为本地化行业中最热门的话题之一,与以往基于统计的机器翻译 (SMT) 相比,可以使翻译质量提升 30% ,同时解决了远距离语言对的复杂性问题,如中文到英语、日语到英语等。

SDL 的一项近期调查显示,61%的受访者认为机器翻译至关重要,然而找到适合企业自身业务的机器翻译解决方案并非易事。今天小编就邀请到了 SDL AI 和机器学习解决方案副总裁 Mihai Vlad 先生,和大家讨论机器翻译近期的突破和 SDL NMT 的独特之处。

Q : 相比 SMT,NMT 的译文更加自然,您能否解释一下两者之间的差异?

Mihai:SMT 和 NMT 的算法和体系结构有很大的不同。以自动驾驶为例,基于统计的方法使用特定道路的驾驶数据进行培训,汽车可以在特定道路上驾驶得很好。而基于神经网络的方法,不与特定的道路绑定,使用不同道路的驾驶数据进行培训,汽车在任意道路上都驾驶得很好

MT 的发展实际上始于 20 世纪 70年代基于规则的机器翻译,你可以对一组规则进行编码,但很快就会意识到不同的语言对有太多的例外情况,模型变得越来越复杂。1993 年,机器学习被引入到机器翻译中,算法可以通过学习双语语料得到提升,而不是通过预先的规则设定

Q : 人工智能热度持续上升,每家公司都声称具备人工智能技术。机器翻译是 SDL 多年来在人工智能方向开拓的应用之一,那么在机器翻译上积累的经验将如何帮助 SDL 开发其他与 AI 的相关应用呢?

Mihai:人工智能旨在让计算机复制人类的行为。看、听、行动、计划都是典型的人类行为,而其中最复杂的任务是沟通,最难的是具备翻译的能力。大约 40% 的全球人口只能说一种语言,43% 可以说两种语言,13% 可以说三种语言,3% 可以说四种语言,只有 1% 可以说四种以上语言。

我们可以移动、跑步,最终协调我们的动作驾驶汽车,但我们不能掌握地球上所有的语言。让机器具备这种能力是非常高的要求。这就是人工智能研究人员将解决 MT 问题看作是 “AI complete” 的原因。


Q: 很多面向消费者的在线机器翻译都使用了开源的技术,为什么企业要考虑使用企业级的机器翻译解决方案呢?

Mihai:与 SMT 相比,NMT 代码更紧凑复杂,一些开发人员使用开源项目,用几百行代码就可以创建一个能够通过数据进行学习的翻译工具。然而,企业解决方案的需求远远超过了几百行代码。可扩展、可集成和通过定制提升质量,只是企业用户在 NMT 代码中需要实现的很少一部分示例。其他例如,通用 NMT 难以很好地处理文档格式,而保持文档格式是任何想要维护文档完整性的组织的关键要求;通用开源 NMT 技术有时还会重复翻译一些词。

然而,通用 NMT 的一个关键问题是训练和翻译成本比 SMT 高几个数量级。而且想要部署这种系统的企业可能会因此而支付大笔硬件费用。

简而言之,使用开源 NMT 系统,你想要得到一个流畅的翻译系统,代价非常高昂,并且在翻译过程中会产生相当多的错误。

三分钟看懂神经网络机器翻译相关推荐

  1. java和python的web自动化有什么区别-三分钟看懂Python和Java的区别

    随着人工智能的火爆,Python和Java一直在各种流行编程语言中名列前茅.其实Java和Python有些相似,因为很多编程语言之间是互通的.Java现在还是第一,不知道Python未来会不会超越Ja ...

  2. python和java一样吗-三分钟看懂Python和Java的区别

    随着人工智能的火爆,Python和Java一直在各种流行编程语言中名列前茅.其实Java和Python有些相似,因为很多编程语言之间是互通的.Java现在还是第一,不知道Python未来会不会超越Ja ...

  3. python和java的区别-三分钟看懂Python和Java的区别

    随着人工智能的火爆,Python和Java一直在各种流行编程语言中名列前茅.其实Java和Python有些相似,因为很多编程语言之间是互通的.Java现在还是第一,不知道Python未来会不会超越Ja ...

  4. 三分钟看懂5G NSA和SA

    原标题:三分钟看懂5G NSA和SA 来源:无线深海 作者:蜉蝣采采 物联网智库 转载 导 读 本文将详细讨论什么是5G NSA(非独立组网)和5G SA(独立组网),以及它们有何异同之处. 01 5 ...

  5. 量子位智库报告:三分钟看懂ChatGPT | 附下载

    量子位智库 量子位 | 公众号 QbitAI 你被ChatGPT包围了吗? 最近这项技术创新项目火得一塌糊涂,你或许听过.见过甚至还慕名试玩体验过了. 但是不是完全灯下黑状态了?不知道ChatGPT从 ...

  6. 云计算机的发展史,三分钟看懂云计算的发展历程

    原标题:三分钟看懂云计算的发展历程 为什么要用云计算?技术发展的需要. 云计算的发展历程 ①最开始,人们使用算盘. ②后来,人们有了网络,也开始普及电脑. ③再后来,人多事少,都去上网,于是服务器吃不 ...

  7. [智能硬件] 1、三分钟看懂智能硬件原理——蓝牙防丢器制作教程(包括手机应用)...

    1 什么是智能蓝牙防丢器 所谓智能蓝牙(Smart Bluetooth)防丢器,是采用蓝牙技术专门为智能手机设计的防丢器.其工作原理主要是通过距离变化来判断物品是否还控制在你的安全范围.主要适用于手机 ...

  8. aps是什么意思_三分钟看懂ERP、MES、APS系统的关联和区别

    ERP系统在于对整个企业与集团企业间的全面管控,APS系统是生产规划及排程系统,MES系统重点在于车间现场的管理,下面用最简单方式讲讲ERP系统.APS系统和MES系统之间的区别与联系. ERP:企业 ...

  9. 三分钟看懂ERP、MES、APS系统的关联和区别

    导读:企业ERP.APS系统与MES是企业实现全面管理规划的重要组合. ERP系统在于对整个企业与集团企业间的全面管控,APS系统是生产规划及排程系统,MES系统重点在于车间现场的管理,下面用最简单方 ...

  10. 三分钟看懂大数据风控中用户行为数据的采集、分析及应用( 转 )

    据统计,目前银行传统的风控模型对市场上70%的客户是有效的, 但是对另外30%的用户,其风控模型有效性将大打折扣. 大数据风控作为传统风控方式补充,主要利用行为数据来实施风险控制, 用户行为数据可以作 ...

最新文章

  1. 资源 | 2018年值得关注的200场机器学习会议(建议收藏)
  2. 【经验分享】Hydra(爆破神器)使用方法
  3. 机器学习笔记十一之降维
  4. python证券_基于Python爬取搜狐证券股票过程解析
  5. electron 打开调试_构建基于 iOS 模拟器的前端调试方案
  6. canvas 绘制直线 并选中_canvas绘制飞线效果
  7. 提升进程权限的几个常用函数
  8. Java基础(彩票小程序)
  9. freeswitch通话记录mysql_freeswitch电话计费详单入库方法
  10. 微信小程序之模板的使用
  11. 舞魔金星[读书笔记]
  12. linu安装mysql5.7
  13. 下载文件plus.downloader.createDownload
  14. 基于知识图谱的问答系统简单流程理解(开放型知识图谱、实体类型较多的图谱)
  15. 报表工具对比选型系列用例——多源分片报表
  16. Project Euler in Java [001-040]
  17. Android 学习笔记-时间_日期_记时器_倒计时器
  18. HTTP/3: 性能改进(第2部分)
  19. 关于 imtra-mart 的 新研究
  20. 使用Pygame制作2048小游戏

热门文章

  1. 苹果动图分享给android,苹果实况图片怎么发给别人
  2. 使用Spring Validation 完成后端数据校验
  3. 游戏策划:为什么我的儿子不沉迷游戏?
  4. 公务员面试综合分析真题解析3
  5. Hash算法及常见碰撞解决方法
  6. bada 2D游戏编程——开篇说明
  7. HTML5分级标题,最佳HTML5结构,其中标题/标题是文章标签外
  8. Android 侧滑抽屉菜单
  9. KUKA WorkVisual 编程教学
  10. python处理word文档中表格 添加一列_Python操作word文档插入图片和表格的实例演示...