周志华:“数据、算法、算力”,人工智能三要素在未来还要加上“知识”

算法在获得了大量数据和算力的情况下,可能会爆发出极大的威力,但这需要高昂的成本,周志华教授认为,以后可以让工业界承担对性能的追求,学术界做探路和思考未来的事情。

反绎学习

逻辑推理可以非常容易的利用我们的知识,而机器学习比较容易利用数据、证据、事实。人类的决策往往既用到了知识,又用到的证据。那么是否可以把两者结合起来呢?在以往的实践中,都没有很成功。主要的障碍在于这两者是基于完全不同的表示方式的。

逻辑推理是基于一些逻辑规则描述出来的知识来帮助我们推理判断,而机器学习则是收集许多数据,使用数据训练一个模型出来,但获得的数据本身和逻辑很难兼容,例如逻辑中的“任意”,“存在”代表着无限大的数据集,又如若把“parent”当成一个属性,则逻辑句子刻画的并不是样本,而是样本间的联系。

在历史上,也有研究者尝试把逻辑推理与机器学习结合起来,大致可分为两个方向。

第一个方向是,做逻辑推理的学者尝试引入一些机器学习的基础技术或概念。最简单的例子是,对于每个逻辑子句来说,它要么是成立的的,要么是不成立的,而逻辑推理的学者给每个逻辑子句加上了一个权重,这个权重表示这个句子成立的概率。

第二个方向是,做机器学习的学者加入一些逻辑推理方面的东西。比如说,对于一个逻辑子句,如果他抽烟,那么他很有可能得癌症,我们就可以把任何一个X,如果他somke,和cancer连接起来,就是说,用逻辑子句帮助我们做网络的初始化,之后该怎样训练就怎样训练。

第一个方向是推理重而学习轻,第二个方向是学习重而推理轻,两者都没有充分的发挥推理个学习结合的威力,周志华教授提出了一个新的方案,Abductive learning。


反绎的意思就是从一个不完全的观测出发,得到一个集合很有可能的解释。

人类对现实问题的抽象上,通常有两种方法,一个是演绎,另一个是归纳。

演绎:从一般性原理出发,得到明确的结果。

归纳:从大量的事实总结出一般规律。

定理证明是演绎的代表,而机器学习则是归纳的代表,反绎学习就是把演绎反向嵌入到机器学习归纳中去。

我们现在的机器学习首先要有很多的instance,这是样本,要有很多的label,这是训练样本已经知道的结果,我们把它们合起来进行监督学习得到一个分类器。

反绎学习则是我们有一些样本,但只知道表现,不知道结果,同时还会有一个初始分类器,分类器一开始会猜测样本的表现,得到一个结果,然后我们利用知识库里的知识来发现是否有什么东西是不一致的,若有,我们是否能找到修改什么后,就能一致了。然后我们修改这个东西,得到一致的结果,这个修改的结果就叫反绎。

反绎出来的东西可以对原来分类器猜测的表现进行修正,得到新的结果,新的label,接下来我们用修改过的label和原来的数据一起训练一个新的分类器,这个过程可以一直进行下去,直到得到的事实和知识库完全一致。

在反绎学习中,我们利用了初始分类器和知识库中的知识代替label,进行了监督学习。

监督信息是来自数据之外的地方,从这个角度,反绎学习可以看做非常广义的弱监督学习,在实际的训练中,若是我们有label,完全可以把label加入到反绎学习中去。

反绎学习中的初始分类器可以用另一个任务的结果,甚至是数据聚类的结果也可以。关键点是,初始分类器不一定要很精确,只要能够把它启动起来就可以了。

当初始模型非常粗糙时,如果知识库的知识靠谱,那就能通过知识库的信息来修正分类器,能进行下去。如果知识不太精准,而初始模型比较好,也能往下学。如果两者都好,当然可以做得更好。

接下来就是知识库了,而知识库暂时只能由人类的专家进行提供。


我们现在经常在谈数据、算法和算力三要素,未来或许应该考虑进知识这个要素,知识凝聚了人类积累的智慧。过去十几年,我们都是从数据驱动的角度来研究人工智能,现在可能是时候把数据驱动和知识驱动结合起来了。

P5 周志华:“数据、算法、算力”,人工智能三要素在未来还要加上“知识”相关推荐

  1. 周志华:“数据、算法、算力”,人工智能三要素在未来还要加上“知识”

    点击蓝字  关注我们 作者丨李雨晨 来源丨AI科评论 2020 年 8 月 7 日,全球人工智能和机器人峰会(CCF-GAIR 2020)正式开幕.CCF-GAIR 2020 峰会由中国计算机学会(C ...

  2. 周志华:“数据、算法、算力”人工智能三要素,在未来还要加上“知识”

    点击上方,选择星标或置顶,不定期资源大放送! 阅读大概需要15分钟 Follow小博主,每天更新前沿干货 来源:AI科技评论 作者:李雨晨 2020 年 8 月 7 日,全球人工智能和机器人峰会(CC ...

  3. 周志华:“数据、算法、算力”人工智能三要素,在未来要加上“知识”| CCF-GAIR 2020...

    来源:雷锋网 作者 | 李雨晨 如何将"机器学习"与"逻辑推理"相结合,是人工智能领域的"圣杯问题" " 编者按:2020 年 8 ...

  4. 周志华:“数据、算法、算力” 人工智能三要素,在未来要加上“知识”!

    干货 分享人:周志华教授,来源:AI科技评论 作者:李雨晨   编辑:丛末 在CCF-GAIR 2020 的人工智能前沿专场上,南京大学计算机系主任.人工智能学院院长.CCF会士.ACM.AAAI.I ...

  5. 牛人(周志华)推荐的人工智能网站

    牛人(周志华)推荐的人工智能网站  分类: 机器学习(4)  版权声明:本文为博主原创文章,未经博主允许不得转载. 转载自周志华老师个人主页:http://cs.nju.edu.cn/zhouzh/z ...

  6. 【吃瓜教程】周志华机器学习西瓜书第三章答案

    线性模型结构梳理 3.1 试析在什么情形下式3.2中不必考虑偏置项b 答案一: 偏置项b在数值上代表了自变量取0时,因变量的取值: 1.当讨论变量x对结果y的影响,不用考虑b: 2.可以用变量归一化( ...

  7. 周志华-机器学习西瓜书-第三章习题3.3 编程实现对率回归

    本文为周志华机器学习西瓜书第三章课后习题3.3答案,编程实现对率回归,数据集为书本第89页的数据 使用tensorflow实现过程 # coding=utf-8 import tensorflow a ...

  8. 《机器学习》周志华课后习题答案——第三章 (1-7题)

    <机器学习>周志华课后习题答案--第三章 (1-7题) 文章目录 <机器学习>周志华课后习题答案--第三章 (1-7题) 一.试析在什么情形下式(3.2)中不必考虑偏置项b. ...

  9. Tom Mitchell、杨强、周志华共话算法未来,世界人工智能大会算法峰会报名中

    算法一直是推动人工智能技术跃迁的关键.当前,产业界的需求.数据的红利,为人工智能的发展提供了最佳时机,同样也对算法提出了新的要求.如何揭开深度学习"黑箱"?下一个引领AI的算法是什 ...

最新文章

  1. CodeForces 362C
  2. 127 - Accordian Patience
  3. Android Lifecycle 生命周期组件详解
  4. 全套Python数据分析常用命令速查表!PDF文档限时分享
  5. Win10 Build 11099和11102的更动超过1200项
  6. Java初始化顺序研究
  7. SpringBoot之打包错误
  8. 如何七周成为数据分析师
  9. 优秀的程序员是这样的
  10. 4行代码,Python玩转美图秀秀
  11. finereport java无符合资料_Java报表工具FineReport常见的数据集报错错误代码和解释...
  12. 关于VMware增强型键盘驱动程序
  13. 学生管理系统测试用例
  14. linux opendir路径_Linux下目录文件的操作(opendir,readdir,closedir) 以及DIR,dirent,stat等结构体详解...
  15. 省市级联实现,并根据IP自动获取省市
  16. 用微PE安装KALI LINUX到U盘,【U盘安装kali】U盘 kali pe三合一教程!装机,存储
  17. elasticsearch 使用词干提取器处理英语语言
  18. 床帘机器人_如何打造一个更舒适更智能的大学宿舍?
  19. 程序员约架事件中,薛非为何不应战?
  20. 微信小程序 - video组件poster无效 / 视频播放列表

热门文章

  1. h3c服务器显示非法的文件,H3C License server 故障处理手册-5W201
  2. cass插件_第009期分享:Cass插件合集
  3. python二叉树遍历例子_python数据结构之二叉树的遍历实例
  4. python argv 详解_详解sys.argv[]的使用方法
  5. python format 时间格式
  6. 图论:二分图多重匹配
  7. 第4.17章读书笔记
  8. 自学Python八 爬虫大坑之网页乱码
  9. MyEclipse6.5设置
  10. LeetCode(169)——求众数(JavaScript)