朱小燕教授在雷锋网组织的 AAAI 中国之夜活动上进行分享

在雷锋网组织的 AAAI 中国之夜活动上,AAAI 现任执委杨强教授、清华大学智能技术与系统国家重点实验室主任、信息获取课题组的学术带头人朱小燕教授、今日头条实验室总监李磊、iFly.vc 合伙人沈瀚、物灵科技人工智能首席科学家吴惟心、iPIN 创始人杨洋在现场做了分享。沙龙从下午五点半持续到晚上九点,据雷锋网现场编辑团队表示,活动氛围非常热烈。

本篇是雷锋网根据朱小燕教授在现场的分享整理而成。朱小燕教授所在的研究小组近十几年来在自然语言处理、文本挖掘、问答/对话系统等领域,针对文本信息内容,在信息度量、知识表示等方面进行了过深入研究。发表论文100余篇,曾经获得Coling2010最佳论文、ACL2012最佳学生论文。目前主要工作围绕基于知识的智能信息获取、基于语义的信息服务展开。

| 信息能够度量,知识能够计算

互联网为人类生活带来了翻天覆地的变化。我们都觉得互联网是无所不能的,大家都说内事找百度,外事找 Google。但是,经过一段时间的研究,我们发现,实际上从互联网上用搜索技术能够直接得到的信息最多也就是70-80%。因为,有些表达结果的内容不是简单地,以显性的形式放在那里,而是要通过逻辑分析推理才能够得到的。人类最伟大的地方是发明了文字。它将语言记录下来,文字描述的内容中蕴含了丰富的知识沉淀,代代相传,是的人类能够 “站在巨人的肩膀上”去了解这个世界,推动这个世界发展。如果在对互联网信息处理的时候,不使用知识,而仅仅是依赖互联网表面的内容的话,就会像现在女孩家里的东西一样,买买买,但是买了之后没有很好分类、入库、管理。不停的堆积,很多东西很快就找不到了,也就不去找了,再去继续地买买买……即影响使用时的效率,又造成无比的浪费。因此,现代的智能信息处理必须要充分地利用各种知识。

我们现在生活在信息社会,信息如何表示、信息与信息之间的关系如何度量(使用什么度量衡,什么叫大小,什么叫相似?)人类的知识绝大多数是以文字形式存储的。知识如何表示、知识与知识之间的关系如何计算?这些问题在信息社会,尤其在全社会都非常迫切地希望利用AI技术进行智能信息处理的今天,变得越来越重要。

因此我们曾经提出过一个努力的目标:信息能够度量,知识能够计算。现在主要工作之一也在做各种努力使得智能信息处理系统能够建立在知识库的基础上,对知识进行各种处理和调用,使之能够在系统计算框架中起到应有的作用。

| 对从业者的建议

此外,朱小燕教授还以一名被咨询者的角度分享了她本人对从业者的一些建议。要做好AI+,以下四个方面需要注意:

  • 第一, 要想“+”人工智能,企业本身就需要清楚自己到底想要AI为你改变些什么。希望“+AI”后面产生什么变化(结果),比如产品想换个大方向还是换一个新面孔? 用它来创业,你必须要清楚所做的是否能够真正体现人工智能的特色。 这样人工智能工程师才会能帮你。

  • 第二,要跟人工智能专家沟通。目前的AI技术绝对是有可为而且有可不为的。有的成熟了,有的还在尝试甚至是幻想阶段。产品设计时要用成熟的技术才有可能达到实用效果,产品才能上线。或者就是在大企业研究院做概念产品,也行。例如,在学术界,现在的最先进的机器人灵巧操作必须是触觉、视觉、控制,甚至还有语音的交互的多模态融合系统才是有挑战性的。国际比赛,十样东西堆放在一起,在视觉引导下两个小时抓起来四个就是第一,有好几个组一个都没抓起来。因为指示要抓矿泉水瓶,抓起来香蕉,不算成功,要眼手配合,眼指挥手上下左右自由行动灵巧抓取才行。现在的机器人多任务灵巧操作/抓取离实用还有一定距离了。期待机器人(臂)像人甚至像猴子那样在树枝上采摘苹果,是不太现实的。而且也没必要。实际产品没必要要求做多维度灵巧抓取,3-4个维度就可以了,看起来没有电影里的机器人那么酷,但是能够比较好地完成自动采摘任务。有公司已经设计出产品,看起来挺靠谱。

  • 第三,关于数据。大家会觉得有很多(大)数据。但是需要考虑一下:这些数据你真的能拿到吗?即便在手真的好用吗?之前有个世界五百强的企业跟我们说手上有很多数据,确实是。而且提出的任务也是非常符合人工智能信息处理的场景的。但是项目开始后不断发现问题,几经周折,第一期的数据终于到手,不过,从中提取出来的有用信息基本上是 0。这个任务可真是“任重而道远”,值得庆幸的是最终应该能够完成。数据处理的时间和资源消耗是非常大的,而且在一些场景下是一时的,在另一些场景下将会是永远的,没有一定的经济实力和思想准备,是很困难的。另一方面如果数据与时间相关与社会媒体内容相关,比如社会舆情数据,就更要考虑数据获取的稳定性,如果不能及时第一手拿到或者产生数据,万一被人掐住,可能会直接威胁到产品的生命。

  • 第四,通用人工智能是很难的。语音处理是通用性比较好的一个领域,图像其次。文字是语言语义的沉淀积累,现在要在其上边在做语义处理,就是更加具有挑战性的了。我们现在在做的问答对话系统,也想做成通用的。但是一句话叫隔行如隔山啊,做什么都能干的东西是挺困难的。另外一个方面,还需要注意的是在领域专家和技术专家之间要有一个沟通,有很多领域专有的表达形式在面向大众的产品中是难以被理解的。

如果说到有什么可发展的地方,我个人期待语音再往前迈一步,使得我们60岁以上的尤其是南方老人也能够比较自如地使用语音与机器交互了,那么在居家养老领域应该能够有更好的产品出来。语音技术和产品在别的方向上很好,但是离用到老人使用还差那么一点点,就这样一点点就很重要。对于孩子而言,这个东西怎样才能让他们不是玩了两天就腻了,而是成为他们真的意义上的一个陪伴,这还真挺难的,挑战不在技术。

| NLP 学术和产业有何不同

在分享的最后,雷锋网(公众号:雷锋网)还向朱小燕教授请教了做 NLP 学术和产业有什么不同的问题。

朱小燕教授说做计算机应用领域的学术研究,内容应该是跳起来能够够得着的,当下不那么踏实,但是,条件好了就能够使用。比如某研究院说要做能够观察人的面部表情情感变化,做能够进行情感交流的机器人。作为研究可以,作为概念产品可以试试,作为赚钱的产品就比较困难了。首先你就要叫计算机知道什么叫表情变化,大喜大悲容易,平时的细微表情变化就难了。又有多少人会察言观色,会到什么程度?家庭陪伴机器人假定的服务对象多半是老人,老人脸上就更不容易识别出喜怒哀乐的变化了。这些做研究是可以,有能力的企业可以做这样的研究做基础沉淀和展示,但是做产业就要想清楚了。再比如做陪伴老人的机器人产品。如果是行走机器人就要想清楚,机器人腿脚不方便,老人腿脚也不方便,两个腿脚不方便的在一起(笑)。这个东西还有不少问题需要解决。但是研究肯定是可以的。

本文作者:刘子榆

本文转自雷锋网禁止二次转载,原文链接

清华大学朱小燕教授做客雷锋网沙龙,分享 NLP 和人工智能的那些事儿| AAAI 2017...相关推荐

  1. 演讲实录丨清华大学朱小燕教授:对话系统现状与展望

    2021-02-23 22:49:59 2020年11月20日,由中国科学技术协会主办,中国国际科技交流中心.中国人工智能学会.新加坡通商中国承办的"中新数字经济与人工智能高峰论坛" ...

  2. 极客日报第 44 期:北大拟开设人工智能班,朱松纯教授领衔;网传富士康向拜腾汽车投资两亿美元,拜腾目前无法给出回应

    文章目录 一.互联网快讯 二.程序员专属 三.Github 每日精选 四.CSDN 社区优质博文精选 一.互联网快讯 1.北京大学拟开设通用人工智能实验班,或由朱松纯教授领衔 1 月 4 日,据悉北京 ...

  3. 朱松纯教授:可解释性是人工智能获得人类信任的关键

    转自 通院BIGAI 6月6日,北京通用人工智能研究院院长朱松纯教授受邀参加由中国人工智能学会主办的CICAI国际人工智能会议,并带来了<可解释性人工智能:如何让机器获得人类有依据的信任> ...

  4. 雷锋网专访陌陌产品总监雷小亮

    社交是人类的一个基本需求.虽然时代发展和科技进步,已使传统的社交方式发生了种种变化,但是人与人之间那种渴望进行真诚的交流的核心并未改变.移动互联网兴起后,基于LBS的移动社交蔚然成风,雷锋网也曾报道不 ...

  5. 地表最强!北大清华合力打造通用人工智能实验班,朱松纯教授领衔

    AI科技评论报道 今日,北京大学官方微信发文称:北大清华联手开启通用人工智能实验班. 课程总负责人是在两个学校都有教职的朱松纯教授. 联合开课的"官宣"时间点正值清华大学110周年 ...

  6. 89岁教授起诉知网获赔70万:自己的论文竟要花钱才能看?

    短短几天时间,中国知网多次登上舆论的风口浪尖."知网擅录九旬教授论文赔偿70多万"等消息在微博上引发热议.有媒体报道称,89岁的中南财经政法大学退休教授赵德馨把中国知网给告了,原因 ...

  7. 北大智能学院成立!AI视觉泰斗朱松纯教授任院长

    转自:新智元 三大新学院凑齐! 近日,北大成立了智能学院(School of Artificial Intelligence). 据透露,人工智能领域国际领军人物.三次问鼎计算机视觉领域国际最高奖项马 ...

  8. 清华大学朱文武团队夺冠AAAI 2021国际深度元学习挑战赛

    点击上方,选择星标或置顶,不定期资源大放送! 阅读大概需要5分钟 Follow小博主,每天更新前沿干货 转自:机器之心 清华大学朱文武教授团队摘得AAAI 2021 国际深度元学习挑战赛(MetaDL ...

  9. 定了!AI视觉泰斗朱松纯教授归国就任北大人工智能研究院院长

      转载于 新智元   来源:北大新闻网 编辑:白峰.依明 [新智元导读]北京大学官网显示,前UCLA教授朱松纯受聘担任北大人工智能研究院院长,北大常务副校长龚旗煌代表学校,对朱松纯受聘北大表示热烈欢 ...

  10. 雷锋网的那些段段(一)。

    微信是长尾小游戏的机会? 老缅 2013-01-09 17:51 2条评论 分享  标签:移动应用 微信 游戏 移动互联网发展至今天,细分起来哪个领域最赚钱? 这是一个即使不是很了解业界也比较容易解答 ...

最新文章

  1. WEB攻击手段及防御第1篇-XSS
  2. [Android 插件化(一)] DynamicLoadApk的用法
  3. JRebel : java.lang.OutOfMemoryError: PermGen space 异常
  4. 前端学习(2685):重读vue电商网站6之如何重置表单
  5. [Web Chart系列之三] 图形布局-Layout
  6. Java的jdk1.6与jre1.8中存在的差异
  7. IOS中的多线程之GCD
  8. 基于android鲜花销售app,基于Android的鲜花APP设计任务书
  9. Java中sleep,wait的区别
  10. 服务器是怎么响应服务器的细节,我怎样才能得到响应从Web服务器
  11. imagenet ILSVRC2012下载及其matlab处理方法
  12. 对多元函数微分一些思考和总结
  13. sit是什么环境_DEV SIT UAT PET SIM PRD PROD常见环境英文缩写含义
  14. 并行计算:openMP(一)—— parallel,for,sections指令的用法
  15. Python中采用scapy来构建IP数据包
  16. 关于Navicat连接mysql数据库报host XXXXXXX is not allowed to connect to this mysql server
  17. 基于单片机的篮球计分器系统设计(#0456)
  18. Android studio Chipmunk 新的gradle规则变更
  19. 怎样查看和修改配置Git用户名和邮箱
  20. 深度学习算法面试常问问题(二)

热门文章

  1. 软件测试之静态测试和动态测试
  2. Android热修复之Sophix初探
  3. 海康门禁C# demo-开,关,常开,常关,授权,清权
  4. 装系统缺少硬盘驱动_缺少操作系统-向我学习,请在今年备份您的硬盘!
  5. java 异或表示状态
  6. 集成算法 | 随机森林回归模型
  7. 上帝视角!美国记者用公开数据,还原川普的全天行动轨迹
  8. 无线电通信天线的种类
  9. 技巧篇:常用的vba代码汇总
  10. GTP 协议常用术语