想做的事情很多,但是时间却很有限。所以我们更应当在开始任何事情之前,做好足够的计划和准备,这样才能在有限的时间里做出最恰当的选择,为自己真正值得做的事争取出更多时间。之所以有这个感悟是因为最近太多事情要做,但是却一团糟,所以突然发现,或许应当做一个更为严密的计划!

第十一讲,是来自微软亚洲研究院首席研究员周明老师的分享,它主要是针对自然语言的一些技术、自然语言当前获得的标志性进展以及发展大趋势等方面提出自己的一些看法,对于我们理解当前人工智能大潮下智能语言的理解具有很好的帮助,所以可以耐心地体会一下,也可以结合之前李航老师的分享进行一下理解,虽然二者都是关于自然语言处理、技术及趋势的观点,但是在看待的角度上还是很不一样的。

一、课堂回顾

小冰爸爸——周明老师

周明,博士,现为微软亚洲研究院主任研究员。主要从事机器翻译和自然语言处理等方面的研究。在加入微软研究院之前为清华大学计算机科学与技术系的副教授。曾经主持过多项自然科学基金、航天基金、博士后基金,并曾与日本、香港、韩国进行过多次合作。在国内和日本领导过三项商品化软件的研发。周明老师于1999年加入微软亚洲研究院,并主要负责自然语言研究组的工作,微软输入法、英库词典(必应词典)、中英翻译、微软中国文化系列(微软对联、微软字谜、微软绝句)等重要产品和项目的研发,并对微软Office、必应搜索、Windows等产品中的自然语言技术做出了重要贡献,并且周明老师也参与了小冰的研发,所以也可以说是小冰的爸爸了。

分享内容

1、自然语言技术概览

从自然语言技术的发展取得了一些进步:

自然语言技术通过自然语言处理的过程,可以达到自动文摘、多文档摘要、单文档摘要,主要可以用于神经机器翻译、聊天机器人、阅读理解、创作、简历信息的抽取等,还有一些可能的应用方向是写对联、写诗、生成音乐等。从中可以看到,随着智能程度不断提升,慢慢地会有越来越多更好玩的东西产生。

2、自然语言的一些常见应用场景

自然语言走向应用的过程中,遵循从简单到复杂的规律,比如从翻译-》聊天-》阅读理解-》创作,目前比较常见的就是在翻译中应用会比较多,而且效果也相当不错;

神经机器翻译:

(1)深度学习方法:主要就是编码和解码的过程,通过RNN+LSTM及注意力模型,输入句子的编码可以得到当前句子的语义表达,又因为每个句子的成分权重不一样,所以对编码的解码引入注意力模型型进行解码就知道句子的意思了。也就是说,在翻译的时候,因为针对同一个编码,有可能在不同的语境下表达的意思是不一样的,这个时候就需要借助注意力模型,找出句子的核心成分,使得解码的句义更有针对性。其实经常使用谷歌翻译的用户就知道,现在翻译的准确率比以前要好了挺多的,这也许也得益于深度学习这些神经网络方法的创新。

(2)transformer_based 翻译:这也是一种基于编码-解码的方法,只不过它会直接在编码和解码之间建立注意力机制,获得相关权重,减少句子、词之间的传播路径,并且借助矩阵乘法使得模型的计算并行化,优化了模型的计算效率。

(3)对偶学习:它和常见的神经网络翻译的双语训练有所不同,一开始的时候只采用一种语言进行训练,比如只用中文,然后中译英,再英译中,最后通过比对句子间的差距来调整神经网络的参数即可

(3)推敲网络:传统的机器翻译一般编码之后只进行一次解码,而在大多数语言使用的过程中,其实语言成型之后还需要经过多次润色和修改,也就是有一个推敲的过程,所以推敲网络会对句子进行两次解码 ,第一次是解码生成原始的句子序列,然后再经过对原始语句的推敲之后,获得新的打磨好的语句。

(4)双向一致性翻译:对句子的翻译过程,采用从右至左,从左至右,对比一致性,然后获得新的损失函数,通过调整网络参数使得损失函数极值化即可。

(5)手语翻译:手语的翻译是一个交叉性的课题,因为不仅仅局限于文字对文字,还涉及对手势语言的识别和翻译,所以难度上是加大了的。之前看到一篇报道中说,有两个研究生的同学研发出了一款手语的智能臂环,它通过在手环上安装多个传感器,识别手语发出者的手部的力度、速度等信号,与之前的训练形成比对,从而识别出当前手语输入的内容。这个手臂环的应用,可以实时把手语翻译成语音,而语音又可以合成文字显示在手臂环的屏幕上,这样就达到了手语翻译的效果。从这一点上,一个有心做产品的人,也应当是一个充满慈悲心的人,因为善良,我们会想着那些折了翅膀的天使,想着那些仍然生活在黑暗中的人,如此我们的设计的产品可能会多出一份温暖和爱意。

聊天机器人:

聊天机器人主要有两种模式,第一种是基于检索的方式,这种方式下会有一个庞大的库存语对,经过分类,用于对话发生时的检索。

第二种方式是端到端的,直接进行编码和解码,它需要的先验知识是对话的主题以及背景的知识库。

类似地还有新闻生成、智能音箱、客服等,如敦煌公众号客服系统。从这一个维度上,细心观察的话,我们就会发现类似于淘宝、一些公众号都采用了只能的客服,就是根据过往客服常见问题,整理好了相应的语对,并在检测到这个问题的提问关键词时,给出这个问题的答案,可以节省大量的人工。

阅读理解:

阅读理解主要是给出文章和问题,然后基本的算法过程是先做 word-embeding ,然后进行编码,解码,最后锁定问题答案所谓的边界,最后给出答案。在这个过程中,其实和人的思考方式是基本相同的。还记得当年英语老师也是告诉我们,你们首先要读懂题目问的问题是什么,然后带着问题回去读文章,读文章的过程中锁定答案的区域,最后根据题意给出答案。

诗歌创作:

当机器语言的智能到达一定程度之后,就可以按照人类输入的规律和主题等,进行诗歌、对联、音乐的创作,虽然目前看来,创作的水平还比较拙劣,甚至会让人觉得有点可笑,但是这就像一个牙牙学语的孩子,假以时日,一定会慢慢地进步,不敢保证高超的审美艺术水平,但是对仗工整、符合押韵等创作规律是一定可以达到的。

3、nlp技术的5-10的趋势

(1)口语机器翻译完全普及:这个应用会植入我们的手机中,进行口语的实时接收和翻译。到那时候,我们做很多事的语言障碍就会被克服,直观的想象就是,你可以自由地环游世界,假如你有钱,你还有时间,你还不怕累,尽管去;

(2)自然语言对话(聊天、问答、对话)达到实用。各种智能助理,办公、家庭服务、教育、导购等;

(3)智能客服+人工客服:大大提高咨询及售后的客服效率;

(4)自动写诗、新闻、小说、流行歌曲等会开始流行起来;

(5)推动语音助手、物联网、智能硬件、智能家居的普及;

(6)与其它一些智能语音技术如视觉、视频等结合,在金融、经济、法律、服务等行业发挥更大作用

简言之,如果人工智能是这个时代的王者,那么自然语言就是这顶王冠上的一颗明珠,因为一切都以自然语言的理解和表达为大前提。

7、对话

(1)Google IO,自然语言处理真的实用了吗?

目前一些单轮对话的使用已经初见成效,而一些多轮对话的研究也在加紧中,无论是何种技术,都还存在比较大的提升空间。周老师也分享了一个观点,之前很多老师也分享过,就是说,在研发产品的过程中,尤其是人工智能类的产品,过于追求完美才上线是不合理的,因为人工智能是一个尚未成熟的概念,一方面产品的研发没有标准的规范和考量,另一方面,人工智能产品的研发需要更多样化、合理化、可落地的需求,这些需求无法停留在学术或是产品研发的空想,它们最直接也最靠谱的来源是用户。所以,不用等到完美,达到可用,能帮助用户解决一些问题即可先推出,获取更多用户反馈和评论之后结合新技术再进行迭代即可;

(2)视频理解(视频+nlp)

image captioing:图片理解,输入一张图片,自动输出算法对图片的描述,涉及到图像处理及自然语言处理,越来越受到关注;

vedio captioning:对视频进行理解和描述,可实现拍照片、写游记、自动配音乐等一体化的服务;

视频自动生成:视频检索、广告、过滤(一些黄色信息、违、侵权等)

在这一种应用上,其实最主要的问题还是说,图片描述、视频描述的训练数据太少,有的都是一些国外的小规模的数据集,可获得的训练数据太少,所以算法的准确率距离落地还有较大差距,而一旦,数据集的问题解决了之后,其实可落地的应用就会在短时间内被实现。

(3)方言语音库太少

可以尝试自己建库,每种方言建一个语料库,但其实小团队或者是个人做这样的事基本没有什么意义,效率会很低很低,真的很低。

(4)智能机器和智能机器之间的对话交流?

所有的机器智能都是人工赋予的,所以如果有交流,也是在人类定义的空间内可控,如果有一天,机器实现了自动编程,而不再完全依靠于人类的程序输入,可能就会生成机器智能。这个问题很有意思,其实和机器是否会毁灭人类有异曲同工之妙。

后话:

对于每一款新产品或者是新功能的研发而言,用户-场景-需求都是很重要的,而人工智能作为时代的弄潮儿,在这三者上都有无限的可能。它可以为任何人、在许多场景下、满足用户的多种需求,所以灵活性比传统的互联网还要高许多,也是因为这样,人工智能产品的研发才需要更多大胆的创想,所以我们在思考产品的时候,思维应当更发散,更天马星空,有的时候你觉得暂时不能实现好像也没关系,因为在不断地思考中,你会越来越清楚,将来我们会遇到一个什么样的世界,我们的用户会需要什么?又有哪些更新奇的场景,这些都是在不断地思考和实践中慢慢获得的认识。

最后送自己一句话:无论是决定还是知识,都是自己的,除了自己,没有人能给你!!!

                                

北大AI公开课第十一课--语言智能的进展by微软亚洲研究院周明相关推荐

  1. 北大AI公开课2019 | 微软亚洲研究院周明:NLP的进步将如何改变搜索体验?

    本文由InfoQ家整理首发,未经授权请勿转载 4月3日,北大AI公开课第七讲如期开讲,微软亚洲研究院副院长周明与大家分享了近期自然语言技术取得的进展和创新成果,并探讨了自然语言技术和搜索引擎如何进一步 ...

  2. 微软亚洲研究院周明:从语言智能到代码智能

    来源:NewBeeNLP本文约1600字,建议阅读5分钟本文介绍了微软亚洲研究院自然语言计算组在该研究领域的一系列最新进展. 微软亚洲研究院副院长周明老师报告:From Language Intell ...

  3. 北大AI公开课第七课--AI赋能 智赢未来by科大讯飞胡郁

    今天来打卡英语流利说第三天,希望自己可以坚持下去,说实话,一直以来我都挺喜欢英语的,然后从大一开始,也在网易公开课上听了很多世界名校的计算机专业课.金融.心理学方面的课,感觉对于语感的培养还是很不错的 ...

  4. 北大AI公开课第三课--视觉计算变革与挑战by Face++孙剑

    之前立的flag倒了,今天才来扶,可是有什么办法呢,生活就是要厚着脸皮活下去啊. 今天一起来整理第三课,这是来自face++孙剑老师的分享,因为正好我自己本身也是做计算机视觉的,所以听他的分享,我觉得 ...

  5. 北大AI公开课第六课--自动驾驶与人工智能by百度陈竞凯

    今天来打英语流利说的第二天卡,发现自己在很多事情的处理上不够坚定,对自己的容忍程度估计过高,同时也对别人的自私认知不足,虽然我们不能以自己的标准去衡量每一个人,但说实话,活着没几年,所以无论如何不能委 ...

  6. 北大AI公开课第五课--深度学习处理器by寒武纪陈云霁

    当我们想要养成一个习惯,只要不管不顾地坚持21天就可以了,不敢说这个习惯养成之后我们可以一辈子不失去,但事实是,生活就是会不断地处于各种状态,而任何状态的存在都是一种共存和和解,一开始会不适应,但是慢 ...

  7. 【北大AI公开课13讲全链接+最强干货盘点】中国AI +,群星闪耀时

    转自 微信公众号 新智元 新智元推荐 整理:张易 胡祥杰 [新智元导读]本文盘点了刚刚结束的北大 AI 公开课的精彩干货,附全部的文字实录链接和视频链接,是全景式地了解中国 AI 产业发展现状和趋势极 ...

  8. 北大AI公开课13讲全链接+最强干货盘点:视频+笔记+文字实录

    视频地址:北大AI公开课 专栏笔记:北大AI公开课 刚刚结束的北大 AI 公开课,由北大人工智能创新中心主任雷鸣组织,以把听者培养为"懂产业的 AI 人才"为主旨,邀请了13位顶级 ...

  9. 北大AI公开课2019 | 驭势科技吴甘沙:AI时代的自动驾驶趋势

    在努力的拓展技术和应用对外的边界,尽快的把技术发展到为人类所用的过程中,有很多的技术的挑战,自动驾驶行业尤其如此.自动驾驶技术发展至今也取得了很多进展,3月20日北大AI公开课第五讲,请到了驭势科技创 ...

最新文章

  1. Scanpy(三)可视化函数
  2. AndroidStudio动态调试smali
  3. 1. 各种虚拟机的发展历史
  4. 快速配置 Samba 将 Linux 目录映射为 Windows 驱动器
  5. 工程中DSP代码片断
  6. 微处理器硬件喂狗_硬件基础:微控制器到底是什么?
  7. Centos如何使用SSH远程连接主机
  8. new Class() 与 Class.newInstance()
  9. python使用scrapy_Python实现从脚本里运行scrapy的方法
  10. Android如何进行反编译
  11. 微信小程序如何使用阿里矢量库
  12. 【Paper Quickthrough】2021 Bert 各向异性
  13. Java封装、继承、多态、super杂糅在一起的小练习,公司雇员员工工资问题(Employee),练习扩展:创建一个Employee数组,分别创建不同的Employee对象,并打印某个月的工资
  14. 软件测试背景对渗透测试有用吗,软件测试与渗透测试那个工作有前途
  15. 不间断:即使被刺破,新的软电子设备也不会损坏
  16. Linux随笔19-MySQL主从复制、Percona XtraBackup实现全量和增量备份、ProxySQL实现读写分离
  17. 一个强迫症的电脑上(桌面篇)
  18. Ubuntu图形界面下命令行窗口打开快捷键创建
  19. 《程序设计基础II》实验3——递推
  20. PHP 开发-XAMPP 安装

热门文章

  1. Oracle获取上一年的时间
  2. tiny4412学习(一)之从零搭建linux系统(烧写uboot、内核进emmc+uboot启动内核)
  3. 【心理学】人类误判心理学
  4. 【反编译系列】四、反编译so文件(IDA_Pro)
  5. 30 行 Javascript 代码搞定智能家居系统 1
  6. Java实现 LeetCode 127 单词接龙
  7. AsyncTask源码解析,你需要摸清的细节
  8. google海底光缆图_SubmarineCableMap:世界海底光缆分布图
  9. 2017淘宝天猫年货节套福娃玩法攻略
  10. java基础-字符串String