来源:雷锋网

作者:杨晓凡

本文共3484字,建议阅读7分钟

本文与你分享Tom Mitchell 教授的最新洞见。

编者按:上个月,全球移动互联网大会 GMIC 2018 在北京开幕。此次主题为"AI生万物,谐音爱生万物,科学技术要有人文的温度,机器有爱,真芯英雄"的大会上,全球人工智能领袖汇聚全球业界顶尖领袖,探讨在基础硬件、大数据与开源平台、深度学习为代表的算法等人工智能领域的最新洞见,是年度行业发展的风向标。

会后记者对 Tom Mitchell 教授进行了专访,教授风度翩翩,语言严谨但也非常温和。

Tom Mitchell,美国卡内基梅隆大学(CMU)计算机科学学院机器学习系主任、教授,美国工程院、艺术与科学院院士,美国科学促进会(AAAS)、国际人工智能协会(AAAI)Fellow,他在机器学习、人工智能、认知神经科学等领域卓有建树,撰写了机器学习方面最早的教科书之一《机器学习》,是机器学习领域的著名学者。

记者:现在机器学习非常火热,我们听说今年 CMU 计算机系的硕士博士申请大爆发。您觉得机器这个专业现在过热了吗?

Tom Mitchell:我觉得学生们很聪明,他们知道机器学习可以在未来的职业道路中发挥很大作用,所以他们有充足的理由选择学习机器学习。对于职业选择来说,我了解到要求具备机器学习能力的职位现在有最高的薪水,在美国是这样,我虽然不清楚中国的情况但我相信也是一样的。这方面的人才确实有短缺,因为很多公司都认为,有一些在机器学习方面有天分的员工,会对公司的未来起到关键作用。

记者:您对申请这个专业的学生有什么建议吗?

Tom Mitchell:你可以在编程和统计这两个方面进行充分的学习。我自己就教授机器学习课程,然后课程结束之后查看学生们的表现的时候,我觉得带来最大区别的是他们的数学能力。很多学生都知道如何编程,因为这是要求的。实际上,如果你想做机器学习做的比较好,那你需要数学、微积分、线性代数几门课都学得比较好。所以我现在也对我教的课程做了一些改动,在上课的第一天,学生们可以做一个在线测试,花十分钟左右的时间做一些简单的题目,比如如何做矩阵乘法、如何算导数、如何算一个东西的概率,这可以帮助他们自己以及我判断基础知识水平。我觉得这就是最好的准备方式。

记者:许多知名教授和研究员都被高薪吸引到了科技企业里。有人认为这会影响未来年轻学者的培养,您同意这种观点吗?

Tom Mitchell:这样的观点我并不同意。我自己现在就在学校,我也收到了一些 offer 希望我离开学校到企业里去,他们开给我的薪水也确实比在学校当教授的薪水要高得多。但是我拒绝了他们,我喜欢待在学校里面。但我觉得总的来说,首先,确实有很多学者被吸引到了业界去;这也确实给大学带来了一些痛苦。不过如果你把眼界放得广阔一些,看看 AI 的发展,看看 AI 对整个世界的积极影响,我觉得有才能的人到了企业里面是好事,包括初创公司,他们确实对整个世界造成了影响。那么大学会因此分崩离析吗,也不会。而且我觉得,整个人才库本来就是流动的,我觉得这是其中的关键。如果企业来学校招了更多的人,我们也就培养出更多的教授来。

记者:也有人说科技巨头招走了人以后并没有做出显著的研究成果。您同意这样的观点吗?

Tom Mitchell:这个观点我也不同意。我们很多研究者都用PyTorch或者TensorFlow作为我们深度学习研究的基础工具。那这些工具是哪里来的呢?就是这些科技巨头。那么如果没有这些科技巨头的话,能够使用深度神经网络的人也就少了。所以他们也是有积极作用的。这些科技巨头的问题是,他们没有足够的动力分享自己的研究成果。以前所有的好想法都会公开出来,而到了这个时代,很多好想法会深藏在企业里面。我作为一个学者,对这件事情觉得有点沮丧。不过我也可以接受这个结果,因为我觉得这也代表了 AI 正在走向整个世界。

记者:深度学习是现在最流行的机器学习方法,虽然强大但每个模型都还是只能解决特定的问题。更通用的人工智能有可能通过深度学习实现吗,还是需要等待新的方法出现? 

Tom Mitchell:我觉得我们现在的深度学习方法有一些明显的缺点。比如,虽然我们现在在许多自然语言处理问题中使用深度学习方法,这可以算是自然语言处理领域的最新发展了,但是没有什么深度学习系统能够表示出来我现在说的这句话的意思。因为它们都是基于内容的向量表征的,那我们其实并不清楚一个向量要如何才能表示一个量化的句子。比如我说:"每个毕业了的学生都至少学了三门计算机科学的课程,而且有一位自己的导师。"那么只要我提取出其中的关系是"对于每一个 x,都有 xxx 的 y",想要用向量来表示它就会非常难。那么,着眼未来地看的话,对于深度学习会如何影响自然语言处理,其中一个重要问题就是,我们能否找到一种表示信息的方法,它能够提取出我说的句子中的微妙信息,但同时还具备向量表示这样的相似性特点——两个相近的向量有很大概率表示的是相似的信息。

记者:您如何看待 AutoML?谷歌在研究 AutoML,我们近期采访过的一家中国公司也在研究 AutoML。他们的目标是希望用 AI 生成 AI,减少深度学习开发中需要的人力,降低使用深度学习的门槛。您觉得这是一个有潜力的方向吗?

Tom Mitchell:我觉得开发这些能够自动决定参数、自动决定学习算法的工具是一个很好的方向。不过如果有的公司觉得这样就可以让电脑自己完成这些工作,而不用雇一个很懂的人的话,那就很危险了,这会是一个很糟糕的想法。通过一些工具把问题变得简单永远是好事,但是现实中想要把机器学习运用在自己的应用中的时候,经常遇到的其实是,"我学这个数据能不能学到我想要的学到的东西"、"我要如何表示输入数据才能让它和我选的学习算法兼容"类似这样的问题。这样的问题是现在的 AutoML 还解决不了的。

记者:波士顿动力研发的机器人经常给人带来惊喜,但据我们所知他们使用的还是传统控制理论。用神经网络控制的机器人能够达到那样的表现吗?能的话需要多久?

Tom Mitchell:这是一个很棒的问题。我觉得这其中的关键问题不是要用神经网络替换传统控制方法,而是要把传统控制方法和深度神经网络结合到一起。我觉得我们现在就已经可以看到一些结合的趋势。比如你想想无人机的话,他们就是传统控制方法和深度学习的很好的结合。今年秋天我教的一门课"深度强化学习"就是关于这个话题的。在我关注的范围内,传统控制有一个特点,即便当这个系统要适应一个新环境,那只要这个系统的设计是正确的,我们就有理论可以保证它的动作可以保持在某一个操作范围内。比如,你开一架飞机,让它自动降落,如果它使用是一个传统控制系统,那么这样的传统控制系统就有理论上的保证,不管降落的时候路是不是凹凸不平,它的动作都能保持在一定的操作范围内。那么我们在机器学习以及强化学习里面缺少的,就是这样一种理论,如果系统在新的环境里面要从糟糕的状况学习达到一个好的状况,我们没有什么理论可以限定它在这两个状态之间的过程里会做些什么。传统控制理论就在成功做到了这一点,其中部分原因就是这些系统都是较为简单的系统,所以我们能够推导出这样的理论保证。对于把深度神经网络作为学习机制的系统,它的结果要开放得多,我不是很确定我们能不能得到这样的理论。不过这在我看来会是一个非常重要的研究领域。

记者:您认为脑科学(神经科学)与人工智能之间是什么关系?脑科学的知识在您的研究中是否重要?

Tom Mitchell:神经科学对我自己的研究来说很重要。因为我这几十年的研究里就有接近一半的时间都在做脑成像的实验来研究大脑是如何工作的。目前来说,很不幸的是,神经科学对人工智能的影响很小,而人工智能反过来对神经科学有很大的影响。我个人在两个领域都做着研究,因为我相信在未来的发展中两个学科的互相帮助会比以前更多。我希望我是对的。

记者:前段时间,来自 20 个国家的超过 50 位 AI 学者签署了一封公开信,抵制韩国科学技术院与军工企业联合研发基于人工智能的自主武器。您对人工智能用于武器的态度如何?

Tom Mitchell:我觉得这是人们尝试让 AI 做的最危险的事情之一。我觉得,即便他们的公开信里面点名批评的是韩国,但事实是每个国家都在考虑这个方向。公众也对此缺少了解,当我看报纸的时候,我感到很惊讶,人们担心 AI 会侵犯他们的隐私,但他们并不为 AI 可能会成为武器的这件事情所担心。我觉得这很荒唐,我们似乎关注错了重点。我们现在能做什么还很难说。但我觉得我们应该做的,会和我们对待生物武器、化学武器的事情很类似。我们应该把反对武器化AI的国际性条约作为目标,就像我们成功达成了国际条约阻止化学战争的出现一样。我们确实需要做这件事情。所以我为他们的公开信鼓掌,只不过过单独针对韩国似乎有些不公平,实际上所有国家都有参与。

理性拥抱机器学习热潮:ML祖师爷Tom Mitchell最新洞见相关推荐

  1. 专访机器学习祖师爷 Tom Mitchell:带着理性拥抱机器学习的热潮

    雷锋网 AI 科技评论按:上个月,全球移动互联网大会 GMIC 2018 在北京开幕.此次主题为「AI生万物,谐音爱生万物,科学技术要有人文的温度,机器有爱,真芯英雄」的大会上,全球人工智能领袖汇聚全 ...

  2. CMU机器学习学院院长Tom Mitchell:计算机模拟人脑才刚刚起步

    GMIC 2017 北京大会于4月27日在国家会议中心拉开帷幕.下午,卡内基美隆大学机器学习学院教授兼院长Tom Mitchell带来了<突破人类和机器的边界>主题演讲,探讨了智能从物理的 ...

  3. 什么是机器学习(ML)

    什么是机器学习(ML) Arthur Samuel的理解 Tom Mitchell的理解 Arthur Samuel的理解 "the field of study that gives co ...

  4. 这7位图灵奖得主,竟然今日才入选ACM Fellow,他们可是程序员“祖师爷”

    本文转载自 量子位,作者 晓查 浩楠 罕见! 7位图灵奖得主.计算机科学多项基础研究的关键大牛,竟然今日才成ACM Fellow-- 要知道,ACM--美国计算机协会,全世界最知名.重要的计算机组织, ...

  5. 中国AI论文普遍水?机器学习教父Tom Mitchell的回答是……

    记者 | 阿司匹林 出品 | AI科技大本营(公众号ID:rgznai100) 在人工智能领域,中国目前到底处于怎样的地位? 在年初的两会上,全国政协委员李彦宏曾公开表示:"中国在人工智能领 ...

  6. 诗人般的机器学习,ML工作原理大揭秘

    诗人般的机器学习,ML工作原理大揭秘 https://www.cnblogs.com/DicksonJYL/p/9698208.html 选自arXiv 作者:Cassie Kozyrkov 机器之心 ...

  7. Java机器学习库ML之六关于模型迭代训练的思考

    我遇到的场景是:样本集有5000万条,接近5个G,那么这样的样本集一次导入训练,我放着一天一夜都没跑出结果,机器性能还特别好,是64位linux有128G内存. 针对这样的情况,我想到的是两种思路: ...

  8. Java机器学习库ML之一Dataset和Instance

    Java机器学习库ML官网:http://java-ml.sourceforge.net/ 对于一个机器学习库来说,最基础就是数据处理能力,ml库给了dataset和instance两个类,datas ...

  9. 以人为本的机器学习:谷歌人工智能产品设计概述 By 机器之心2017年7月17日 12:13 取代了手动编程,机器学习(ML)是一种帮助计算机发现数据中的模式和关系的科学。对于创建个人的和动态的经历

    以人为本的机器学习:谷歌人工智能产品设计概述 By 机器之心2017年7月17日 12:13 取代了手动编程,机器学习(ML)是一种帮助计算机发现数据中的模式和关系的科学.对于创建个人的和动态的经历来 ...

最新文章

  1. android tab 悬停效果代码,Android 仿腾讯应用宝 之 Toolbar +Scroolview +tab滑动悬停效果...
  2. 数据中心(机房)施工方案
  3. 使用Go语言从零编写PoS区块链(译)
  4. 延迟反馈带来的样本偏差如何处理
  5. 0305互联网新闻 | 钉钉发布“未来校园”千校计划;海南出台方案鼓励发展网约医疗服务...
  6. Docker 部署ELK 日志分析
  7. “最强”博士论文答辩阵容:6位院士,副院长任答辩秘书!
  8. Docker学习文档之二 搭建环境-Linux环境
  9. centos6.5 最小化安装无法上网
  10. 异步fifo_数字IC校招基础知识点复习(五)——跨时钟域涉及part2(异步FIFO)
  11. 拒绝瞎忙,高效的学习与工作经验谈
  12. 上海计算机二级vb题目,上海计算机二级VB试题(卷).doc
  13. 计算机网络中netbuie,材料内部空隙体积占其总体积的百分率叫做()。A、孔隙率B、填充率C、空隙率D、密实度...
  14. 直播行业迎来多元化发展
  15. 软件渗透测试:定义、需求、过程
  16. 阿里 P9 耗时 28 天,总结历年亿级活动高并发系统设计手册
  17. 【优化算法】多目标灰狼优化算法(MOGWO)【含Matlab源码 099期】
  18. 我的微信扫描二维码实现登录のJava
  19. jsoncpp在vs2012下的环境搭建(C++)
  20. 数据结构题及c语言版严第七章答案,数据结构第七章习题答案.doc

热门文章

  1. 【从零开始JavaEE课设】《影院系统》成品展示——后台管理系统
  2. 如何将WPS转Word
  3. php自动调用打印机直接打印,PHP自动打印到网络打印机?
  4. 施工建设公路的活计用路缘石滑模机的好处
  5. SPSS实现单样本K-S检验
  6. 文本分析 | 年报转换TXT关键词频统计
  7. 揭开程序员装 13 行为的面具
  8. bmap、百度地图自定义画矩形
  9. C++重温笔记(十二): C++多文件编程
  10. suse安装readline-devel