本文来自华为诺亚方舟实验室资深专家刘晓华在携程技术中心主办的深度学习Meetup中的主题演讲,介绍了华为诺亚面向语音语义的深度学习进展。

本次演讲简要回顾了深度学习近十年进展,重点介绍华为诺亚方舟实验室最近两年内和深度学习相关的研究成果,并探讨了深度学习的未来趋势。

深度学习的近十年进展

深度学习为什么现在这么火?大数据、算法突破和计算能力。算法上的突破有包括三点:第一点,对多层神经网络做预训练。第二点,大量标注数据驱动的监督学习和防过拟合技术的结合,例如dropout。第三点,注意力模型。

从应用角度来看,自2012年来,深度学习在语音、图片、视频识别以及自然语言处理等方面取得重大突破等。

  • 语音识别:基于深度神经网络的声音模型替隐马尔可夫框架下的基于混合高斯分布的升学模型,使语音识别取得了突破性进展。目前完全融合了声学模型、语言模型和声学词典的基于深度学习的端到端的语音识别系统也开始出现,并有可能演进为下一代的语音识别系统。

  • 图像识别:2011年,基于深度卷积神经网络的图像识别系统在ImageNet数据集上取得极大成功,并开始有成功的商业化应用。

  • 自然语言处理:自2014年始,深度学习在语法分析、机器翻译、对话等领域都取得了一系列重要成果。

  • 符号人工智能:深度学习开始进入知识表达和推理等传统人工智能的领域,并取得了初步成功。

  • 控制/强化学习:深度学习和强化学习结合催生了深度强化学习技术,该技术在控制领域,如游戏操作和机器人的控制的端到端学习(end-to-end learning),都有了令人瞩目的成功。(揭秘深度强化学习)

诺亚语音语义方面深度学习相关研究

华为诺亚方舟实验室在深度自然语言处理研究(deep learning for NLP)领域具有多年的积累。

  • 深度语义匹配:对待匹配的两个目标对象的各个方面的匹配关系用深度神经网络进行建模。应用之一是基于自然语言的图片搜索:采用文本和图像深度匹配模型做手机上的图像搜索。

  • 自然语言对话:我们提出了第一个基于序列编码-解码算法的神经网络的对话模型。它能够理解你所说并产生合适的应答”。目前这一成果被业界广泛引用。(基于大数据与深度学习的自然语言对话)

  • 机器翻译:传统的基于统计的机器翻译,是从大量的平行语料库中学习大量的翻译规则,然后基于翻译规则来做翻译。它的翻译结果会比较忠实原文,但往往比较生硬。其特点可以用信而不达来概括。2014年基于基于编码-解码算法的端-到-端的翻译系统被提出来了。它先会把源语言句子做语义编码,相当于先理解原句,然后根据源端的语义编码再生成目标句子。为了生成更好的目标句子,它会引入一个“注意力模型”,这个注意力模型会建议生成下一个目标翻译词时主要考虑源句端的哪些词。我们最近做的一个有意思的工作是把“覆盖率模型”这个传统统计机器翻译中常用的技术叠加到了”注意力模型”上,使得在生成下一个目标翻译词的时候,把关注重点能更多的放到那些还没有充分翻译的源句端的词上,从而一定程度缓解过译和漏译问题。这一成果已经在今年国际计算语言学协会大会(ACL 2016)上发表了。(深度学习和自然语言处理中的attention和memory机制)

  • 问答系统:我们的问答系统整体基于端到端的编码解码框架,但把知识库也融合进来了,是业界第一个基于深度学习的基于自然语言的问答系统。在生成答案的下一个目标词的时候,它会判断是否把注意力放到知识库,以及知识库中哪个条目,并从中选出答案作为下一个目标词。

  • 基于自然语言的推理:这一块相关研究我们刚刚起步,我们当前的方法也非常“朴素”。我们目前研究的聚焦在下面的场景:给定若干个事实,以及问题,输出答案。限定答案是某个分类标签,我们把这个任务转化为一个分类问题。

相关链接:深度学习的最新进展及诺亚方舟实验室的研究

深度学习的未来趋势

深度学习还能有哪些突破?从解决实际问题的角度,我们从这三个方面去思考:

  1. 自然语言处理,人看起来简单自然的符号,能否与传统人工智能融合。
  2. 能否将举一反三的能力融入到深度学习中?
  3. 无监督学习是否能有所突破。

结合我们多年的研究和业界实践的经验,目前我们的关注点如下:

  • 更加灵活的表示方式。代表性的工作包括神经图灵机(Neural Turing Machine)、记忆网络(memory network)以及诺亚最近的Neural Transformation Machine和Neural Reasoner。

  • 更加复杂的端到端学习系统。不再拘泥于一个简单的模型,而是多个不同功能的神经网络耦合而成的系统,这个系统可以和现实世界完成对接和交互,能够接受延迟的和曲折的监督信号(和增强学习的结合),是“可微的”,或者至少是可以被优化的(譬如基于抽样的优化)。

  • 和传统人工智能的融合。试图去解决传统符号人工智能任务,推理、知识表达等,可以将符号人工智能的强大的逻辑能力和神经网络的灵活性结合。

  • 和知识库的结合。在对话等需要真实世界知识的场景,我们需要建立一个可以高效动态的访问知识库的神经网络系统。大量需要解决的问题:知识库的表示问题,访问的方式和效率问题,End-to-end 训练的问题,和神经网络内部的“知识”的融合问题。

  • 受教式人工智能:数据+知识驱动的深度学习。面向特定场景,接受教育,自我成长,个性化的系统。(华为研究的畅想: Educated AI (EAI)])

演讲PPT下载:

  • 诺亚面向语音语义的深度学习研究进展

携程技术中心深度学习Meetup系列:

  • 用户在线广告点击行为预测的深度学习模型
  • 深度学习在携程攻略社区的应用
  • 深度学习在搜狗无线搜索广告中的应用
  • 知识图谱中的推理技术及其在高考机器人中的应用

本文由携程技术中心(微信公号:ctriptech)童兰利整理,并经过演讲者本人确认和授权发布。
责编:周建丁(zhoujd@csdn.net)

诺亚面向语音语义的深度学习研究进展相关推荐

  1. 面向医学图像分析的深度学习研究方案

    面向医学图像分析的深度学习研究方案 这是一篇有关"深度学习在医学图像处理方面"的研究报告的第一节,主要包含研究对象,常用方法,深度学习简介,研究现状,研究重点. 在撰写报告时,我找 ...

  2. 2019 到目前为止的深度学习研究进展汇总

    本文为 AI 研习社编译的技术博客,原标题 : Best Deep Learning Research of 2019 So Far 作者 | ODSC - Open Data Science 翻译 ...

  3. cvpr 深度估计_干货 | 2019 到目前为止的深度学习研究进展汇总

    本文为 AI 研习社编译的技术博客,原标题 : Best Deep Learning Research of 2019 So Far 作者 | ODSC - Open Data Science 翻译 ...

  4. 深圳内推 | 华为诺亚方舟实验室招聘机器学习/深度学习算法实习生

    合适的工作难找?最新的招聘信息也不知道? AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职! 华为 华为诺亚方舟实验室是世界领先的工业实验室,在深圳.香港.北京.上海. ...

  5. 华为诺亚加入竞争,看深度学习如何改变机器翻译

    机器翻译,被认为是人工智能和自然语言处理的"圣杯".上个世纪九十年代,机器翻译刚刚经历了一次变革,完成了从以规则为基础的方法到统计方法的变迁.而许多人相信我们正在经历第二次变革,这 ...

  6. 华为诺亚方舟实验室多项强化学习研究成果获IJCAI 2020录用

    本文转载自诺亚实验室. 近期,华为诺亚方舟实验室(决策推理实验室-强化学习研究团队)的3项研究成果被人工智能领域顶级会议IJCAI(录取率12.6%)接收(一作都为实习生,主要工作在华为实习期间完成) ...

  7. 【CIPS 2016】(4-5章)语言认知模型、语言表示以及深度学习(研究进展、现状趋势)

    CIPS 2016 笔记整理 <中文信息处理发展报告(2016)>是中国中文信息学会召集专家对本领域学科方 向和前沿技术的一次梳理,官方定位是深度科普,旨在向政府.企业.媒体等对中文 信息 ...

  8. 自动驾驶中图像与点云融合的深度学习研究进展综述

    点云PCL免费知识星球,点云论文速读. 文章:Deep Learning for Image and Point Cloud Fusion in Autonomous Driving: A Revie ...

  9. DNA/RNA基序挖掘中的深度学习研究进展(A survey on deep learning in DNA/RNA motif mining)

    摘要 DNA/RNA基序挖掘是基因功能研究的基础.DNA/RNA基序挖掘在识别DNA或RNA蛋白结合位点方面起着极其重要的作用,有助于理解基因调控和管理的机制.在过去的几十年里,研究人员一直致力于设计 ...

最新文章

  1. 切记切记:Spring配置文件中,Component-scan无法扫描到的类中的自动装配对象无法被调用,报空指针错误。...
  2. Dataset之OttoGroup:OttoGroup数据集的简介、下载、案例应用之详细攻略
  3. 大数据背后是个万亿市场
  4. 计算机实物知识需求市场调研,能力本位计算机维护论文
  5. opencv python教程简书_OpenCV-Python系列二:常用的图像属性
  6. 6大设计原则之接口隔离原则
  7. 使用三级缓存解决内存溢出
  8. Test for open live write
  9. 车子前进档为什么往后退_「前推倒车·后拉加速」自动挡的档杆为什么设计的这么奇怪?...
  10. [LeetCode] 125. Valid Palindrome Java
  11. 数据结构------递归+迷宫问题+最短路径问题解决思路
  12. 多功能函数计算器(MATLAB实现)
  13. 《多媒体技术与应用》练习题
  14. 孙鑫视频VC编程 优酷系列
  15. html document怎么转换成word,如何将HTML document文件类型转换成word document?
  16. Ubuntu 更改鼠标滚轮速度
  17. 自动化车辆的开发、测试和验证场景
  18. 星星之火OIer:2019.1.5考试总结
  19. 玩转Reactjs第三篇-组件(模式stateprops)
  20. 腾讯全民wifi linux,Linux下安装MT7601U无线网卡驱动

热门文章

  1. Oracle 常用查询
  2. iptables的地址取反操作
  3. leetcode算法题--子数组按位或操作
  4. leetcode算法题--打家劫舍II
  5. python 获取方法名_python 动态获取当前运行的类名和函数名的方法
  6. php 文件迭代对象,通过PHP中的stdClass对象进行迭代
  7. lamp 独立mysql_lamp or lnmp 环境搭建之独立安装mysql数据库
  8. gcp上使用gpu来学习tensorflow
  9. LightOJ 1030 Discovering Gold(期望 概率)
  10. Good Bye G.cn