来源:图灵人工智能

摘要:人工智能到现在已经 60 多年,几起几落,它的兴衰也是围绕着 “AI是不是可以落地” 进行的。


杨强

香港科技大学计算机和工程学系主任

国际人工智能联合会IJCAI理事长

第四范式首席科学家

杨强:一个AI,两种模式

杨强:今天的题目很应景,叫 “落地的人工智能”。这个题目是拿来跟大家探讨的,因为这是一个大题目。人工智能到现在已经 60 多年,几起几落,它的兴衰也是围绕着 “AI是不是可以落地” 进行的。

今天的讲座,第一部分是人工智能概述。

人工智能分为四个发展阶段。初级阶段是感知环境(Perception),我们知道单层的神经网络也叫 perceptron(感知器),是 60 年代就出现的可以简单学习的神经网络。这是 AI 必要的一步,因为要有感知智能,才能收集大量数据,这一阶段需要传感器、互联网、物联网等技术。

第二个阶段是机器学习(machine learning)阶段。能从数据里面学习。第三个阶段是自动推理(reasoning),需要搜索、逻辑、博弈论等技术。最后也是最高阶段是抽象迁移(abstraction),需要有新的理论和系统。

一个AI,两种模式

  • 通用 vs 特殊:有很多人试图解决通用 AI,但现在绝大部分工作还是在特殊的、任务驱动的人工智能。

  • 辅助 vs 自动:比如计算机视觉是辅助型的,相当于给机器戴上了眼镜。无人车是自动型的,因为它的整个运作是自动的,也有自动的学习能力,人类只是为它提供一些必要的资源。

  • 交互 vs 核心:交互型的 AI 是为了跟人沟通,是闭环的。还有一种做法是把 AI 作为一个核心的系统,它的副产品是对人有用,但它可以完全按照自己的方式发展。AlphaGo 就是一个例子。

说到人工智能落地,第一个问题就是什么叫“落地”,谁来规范什么时候AI可以算作“落地了”? 这个标准是首先要建立的。在任何科学与工程领域,都要首先建立测试“成功”的准则,否则就会事倍功半。要知道,智能的测试是非常难以做到公正的,也经历了很多的考验,比如著名的“聪明的汉斯”,是对一匹叫做“汉斯”的马的智能测试,因为一开始没有注意到高维的特征空间,而得到了错误的结论。图灵测试是一种更合理的测试,但也不是唯一的测试。

我认为深度学习的成功主要来自两个方面:第一,层次之间的演化是一种非线性的转化,这种转化如果进行多次,就有可能产生高维空间的 pattern。第二,所有这些加起来,这个网络本身成为一个特征产生器,产生一个高维的空间,在这个空间里,世界上的任何东西(图像、语音等)都会有统一的表达,并且你可以计算它们的距离。

高维度的、统一的特征表达,这就是人工智能想达到的目标。所有的推理、类比、抽象等,都可以在这个空间里得到。但这个空间是通过在数据中学习获得的,这个手段在现阶段是通过大数据,但大数据不是唯一的手段。

AI为什么要有不断创新的能力?

AI 领域每年有上千甚至上万的 paper,是不是说我们就可以躺在 open source 上面,不用创新了?不是的,我们很有必要不断地创新。

一个例子是 GAN,它的一个作用是可以 “鱼目混珠”,生成器可以创造出一些虚假的图片。在金融界就发现有这样的人,他们对深度学习了如指掌,并且可以用AI深度学习的这些手段去欺诈金融的安全系统,因此我们必须要有不断提高的反击的能力。

第二,有些新的学科,比如迁移学习,非常依赖对数据的模拟。GAN 在这个方向是非常有用的工具。

创新的能力也可以体现在跨界的AI应用上。一个例子是斯坦福大学的一个工作,他们的任务是帮助联合国通过卫星图像,让机器自动地给非洲大陆打标签,这些标签指代地区的“贫困程度。” 但是我们看到一个卫星图像,由于标签的缺乏,我们对图像上对应的贫困程度是一无所知的。传统的做法是派人到本地做经济调查,然后把数据收集起来。这样的做法既危险,又耗时,不准确,数据也非常少。

有没有办法自动地做这件事呢?他们想到了迁移学习,而且是多步的迁移学习。第一步是拿 ImageNet 这种图像来学一个切割模型,第二步是比对白天和晚上的卫星图像,以此获得一个初步的经济模型。因为一般认为晚上比较亮的地方是经济发展比较好的区域。由此得出一些 feature 对应经济发达或不发达的地区。最后的结果,用 survey 的方法的准确率是 75%,用迁移学习的方法准确率是 71%。虽然没有人工的那么好,但是非常省力。

我们现在已经有了不少“迁移学习”在产业应用中的实例。如果已经有了大数据产生的模型,那么在一个新的领域,可以用小数据把大模型迁移过来找到这个领域的要点就是找出两个领域的不变量。我们假设一个领域可以用上亿维的特征来描述,那么我们要找两个领域的特征空间共有的部分来做迁移。

AI落地

网约车识别

这里的一个例子是上海汽车的网约车识别

这个问题是:给定车辆的行驶轨迹,如何判断车辆是否网约车?

我们的策略是引入外部数据来进行迁移学习。外部数据有出租车、公交车的行车轨迹。分两步:首先我们有两个空间,左边是出租车的空间,右边是网约车的空间,我们的目的是把知识从左边搬到右边。但是很明显两边的知识是有差异的,要把这些差异剔除,我们用了半监督学习 + 迁移学习。

这个例子告诉我们,AI 的落地首先要目标清晰,清晰到可以把优化函数用数学公式写下来。

第二,需要去找到合适的数据

第三,人才需要领域知识,同时也需要 AI 知识,这种跨界的人才才是 AI 真正需要的人才,否则谈不上落地。

然后,我们也来举一个反例。我们都知道,AI的头几个里程碑都是IBM创造的。但是在AI落地的过程中,IBM也遇到了难题。一个例子就是IBM WATSON在医疗领域的落地。

我们先来看一下IBM WATSON的流程。 首先,当一个问题到来的时候,系统把输入的问题和知识库里的问题加以对比,再按照匹配的概率排序。 如果有匹配度高的问题,那就可以把对应的答案作为输出。

在这个流程中,需要知识库的建立,和问题集的收集。当然,这个流程中又很多依靠机器学习的阶段,比如问题的特征抽取,特征空间的建立,匹配的相似度学习,等。但整个流程的建立还是要依靠专家来进行的。

比如,知识库的建立,知识的扩展,以及问答系统在整个医疗系统中的定位等。恰恰因为这些需要人工的地方成为瓶颈,以至于最终用户的定位错误,导致系统并没有完成既定的任务。最后,IBM只能从美国一个很大的医疗机构撤离,也导致了媒体大量的负面报道。

总结起来,这个例子说明,仅仅在一个游戏领域成功(问答的电视大赛),并不表示在开放的实际场景(医疗)就可以取得成功。 首先,IBM  Watson的目标客户群是医生,还是病人? 系统的角色是助手还是替代? 有没有既懂医疗又懂AI的专家在团队中? 系统有没有做到前端和知识库的维护的闭环?这些有关落地的问题,都有待回答。

总结:

第一,人工智能是走了很长的路,但是除了深度学习以外,还有很多的领域有待发掘。所以千万不要以为深度学习就是人工智能。

第二,人工智能在企业的落地是一门大学问,而且是一门艺术性的学问,因为还没有到科学的程度。所以一个问题是,AI 是产品,还是技术,还是解决方案?第二个问题是,AI 如果在一个领域落地成功,需要哪些基本条件?

最后,我觉得非常有趣的一个点,是 AI 出现了以后、会出现一个新的、以机器智能为主体的产业和社会。那么这个新的商业社会也可能会部分地颠覆我们已有的商学院的知识。现有的商学院的知识主要是针对人的管理和人的决策。那么 AI 对应的是机器的管理和机器的决策,这个学问现在还是空白。

未来智能实验室是人工智能学家与科学院相关机构联合成立的人工智能,互联网和脑科学交叉研究机构。

未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)云脑研究计划,构建互联网(城市)云脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

杨强:人工智能在企业的落地是一门大学问相关推荐

  1. 【清华 AI 公开课】IJCAI理事长杨强:人工智能在企业的落地是一门大学问

    在课程开始,雷鸣老师先概述了对产业有较大影响的技术,以及未来将发生的演变. 从技术角度看,未来对产业产生比较大影响的技术有: 基于视频的信息理解和处理技术 .现在,基于静态的图片的处理技术,比如人脸识 ...

  2. 《联邦学习实战》杨强 读书笔记十四——构建公平的大数据交易市场

    当数据具有资产属性之后,数据便可以直接或者间接地为公司.为社会创造价值和收益,并且可以作为一种特殊的商品在市场中进行交易. 与传统的商品交易相比,数据资产交易的市场前景更广阔,但同时也面临着很多的挑战 ...

  3. 人工智能联合会主席杨强:人工智能如何落地?

    2018年媒体经济学家年会人工智能论坛上,国际人工智能联合会理事会主席.国际人工智能协会执委杨强进行了演讲. 杨强表示,他经历了两次人工智能的火热.最早确定博士方向的时候,大家都劝他选人工智能,之后经 ...

  4. 杨强教授力荐,快速部署落地深度学习应用的实践手册

    香港科技大学计算机科学与工程学系讲座教授.国际人工智能联合会(IJCAI)理事会主席(2017-2019).深圳前海微众银行首席AI 官 杨强为<深度学习模型及应用详解>一书撰序,他提到现 ...

  5. 演讲实录丨CAAI名誉副理事长杨强教授:人工智能的金融实践

    杨强 CAAI 名誉副理事长.微众银行首席人工智能官 AAAI/ACM/IEEE/CAAI/AAAS Fellow 转自中国人工智能学会 CAAI原创 丨 作者杨强教授 以下是杨强教授的演讲实录: 今 ...

  6. 杨强 : 迁移学习——人工智能的最后一公里

    来源:智能系统学报 11月30日上午,第九届吴文俊人工智能科学技术奖颁奖典礼暨2019中国人工智能产业年会在苏州广电大厦演播厅隆重举行.本届大会主题是"突破关键技术·赋能产业落地" ...

  7. Tom Mitchell、杨强、周志华共话算法未来,世界人工智能大会算法峰会报名中

    算法一直是推动人工智能技术跃迁的关键.当前,产业界的需求.数据的红利,为人工智能的发展提供了最佳时机,同样也对算法提出了新的要求.如何揭开深度学习"黑箱"?下一个引领AI的算法是什 ...

  8. 现场 | AAAI执委杨强:未来几年人工智能领域将有哪些技术热点?

    ▼ 大型年度AI人物评选--2017中国AI英雄风云榜已于12月4日在乌镇张榜,12月18日在北京国贸三期举行颁奖典礼. 榜单评选出年度技术创新人物TOP 10:商业创新人物TOP 10,获取完整榜单 ...

  9. 又一重磅嘉宾来袭 | 国际人工智能联合会理事长杨强助阵2018品友互动人工智能大会

    无论是从嘉宾量级还是议程内容来看,2018品友互动人工智能大会无疑是业界最值得期待的峰会. 截至目前,美国人工智能学会院士Daniela Rus.国际人工智能联合会(IJCAI)理事长杨强.北京大学信 ...

最新文章

  1. VBS遍历Excel工作表的方法
  2. vue项目中使用element的dialog中引入ztree却不能初始化解决办法
  3. C/C++ unsigned char*类型
  4. 考研【文法方向专场讲座】附:通信工程院校排名
  5. 34.在排序数组中查找元素的第一个和最后一个位置--leetcode算法题解(带注释)
  6. *【计蒜客 - 蓝桥训练】人以群分(二分 + dp)
  7. 数学国里有座天才云集的“疯人院”
  8. MAC下安装和管理java
  9. 安卓手机充电慢_很火的安卓手机充电特效设置
  10. linux pdf 编辑图层,PDF SDK DEMO
  11. 计算机专业保研预推免面试记录
  12. Mac分区失败导致出现隐藏分区的解决办法
  13. 计算机实训四 表格制作素材,计算机平面设计实训(第3版 赵荣胡昌杰)课件 素材平面图像设计实训04.ppt...
  14. 2013 【第四届蓝桥杯省赛】 C/C++ B组
  15. 【量化交易】永久投资组合,海龟交易法则阅读,回测与讨论
  16. tiktok设备注册
  17. 基于微信小程序的学生选课系统源码
  18. 网络安全评估系统的分析与研究
  19. ubuntu配置jre8
  20. 我的世界java版tp_我的世界原来还存在边界?Java版边界穿越方法

热门文章

  1. 干货 | 20多门AI网络课程资源(附链接)
  2. Science:导入了人类特有基因后,猴脑有了进化的趋势
  3. 从VR到元宇宙:回顾30年,改变虚拟现实的18件大事
  4. 字节跳动这项研究火了:基于残差UNet架构 ,一键分离伴奏和人声
  5. 神经网络debug太难了,这里有六个实用技巧
  6. 阿里达摩院《机器学习算法学习指南》火了,限时开放下载!
  7. 来自Facebook AI的多任务多模态的统一Transformer:向更通用的智能迈出了一步
  8. SAP MM VL32N和MIGO对内向交货单做收货,都会更新其‘总体货物移动状态‘
  9. 银行的双重生物识别实验,是双重麻烦还是双重安全?
  10. 人工智能犯罪:先行预防还是事后严惩