P5 周志华:“数据、算法、算力”,人工智能三要素在未来还要加上“知识”
周志华:“数据、算法、算力”,人工智能三要素在未来还要加上“知识”
算法在获得了大量数据和算力的情况下,可能会爆发出极大的威力,但这需要高昂的成本,周志华教授认为,以后可以让工业界承担对性能的追求,学术界做探路和思考未来的事情。
反绎学习
逻辑推理可以非常容易的利用我们的知识,而机器学习比较容易利用数据、证据、事实。人类的决策往往既用到了知识,又用到的证据。那么是否可以把两者结合起来呢?在以往的实践中,都没有很成功。主要的障碍在于这两者是基于完全不同的表示方式的。
逻辑推理是基于一些逻辑规则描述出来的知识来帮助我们推理判断,而机器学习则是收集许多数据,使用数据训练一个模型出来,但获得的数据本身和逻辑很难兼容,例如逻辑中的“任意”,“存在”代表着无限大的数据集,又如若把“parent”当成一个属性,则逻辑句子刻画的并不是样本,而是样本间的联系。
在历史上,也有研究者尝试把逻辑推理与机器学习结合起来,大致可分为两个方向。
第一个方向是,做逻辑推理的学者尝试引入一些机器学习的基础技术或概念。最简单的例子是,对于每个逻辑子句来说,它要么是成立的的,要么是不成立的,而逻辑推理的学者给每个逻辑子句加上了一个权重,这个权重表示这个句子成立的概率。
第二个方向是,做机器学习的学者加入一些逻辑推理方面的东西。比如说,对于一个逻辑子句,如果他抽烟,那么他很有可能得癌症,我们就可以把任何一个X,如果他somke,和cancer连接起来,就是说,用逻辑子句帮助我们做网络的初始化,之后该怎样训练就怎样训练。
第一个方向是推理重而学习轻,第二个方向是学习重而推理轻,两者都没有充分的发挥推理个学习结合的威力,周志华教授提出了一个新的方案,Abductive learning。
反绎的意思就是从一个不完全的观测出发,得到一个集合很有可能的解释。
人类对现实问题的抽象上,通常有两种方法,一个是演绎,另一个是归纳。
演绎:从一般性原理出发,得到明确的结果。
归纳:从大量的事实总结出一般规律。
定理证明是演绎的代表,而机器学习则是归纳的代表,反绎学习就是把演绎反向嵌入到机器学习归纳中去。
我们现在的机器学习首先要有很多的instance,这是样本,要有很多的label,这是训练样本已经知道的结果,我们把它们合起来进行监督学习得到一个分类器。
反绎学习则是我们有一些样本,但只知道表现,不知道结果,同时还会有一个初始分类器,分类器一开始会猜测样本的表现,得到一个结果,然后我们利用知识库里的知识来发现是否有什么东西是不一致的,若有,我们是否能找到修改什么后,就能一致了。然后我们修改这个东西,得到一致的结果,这个修改的结果就叫反绎。
反绎出来的东西可以对原来分类器猜测的表现进行修正,得到新的结果,新的label,接下来我们用修改过的label和原来的数据一起训练一个新的分类器,这个过程可以一直进行下去,直到得到的事实和知识库完全一致。
在反绎学习中,我们利用了初始分类器和知识库中的知识代替label,进行了监督学习。
监督信息是来自数据之外的地方,从这个角度,反绎学习可以看做非常广义的弱监督学习,在实际的训练中,若是我们有label,完全可以把label加入到反绎学习中去。
反绎学习中的初始分类器可以用另一个任务的结果,甚至是数据聚类的结果也可以。关键点是,初始分类器不一定要很精确,只要能够把它启动起来就可以了。
当初始模型非常粗糙时,如果知识库的知识靠谱,那就能通过知识库的信息来修正分类器,能进行下去。如果知识不太精准,而初始模型比较好,也能往下学。如果两者都好,当然可以做得更好。
接下来就是知识库了,而知识库暂时只能由人类的专家进行提供。
我们现在经常在谈数据、算法和算力三要素,未来或许应该考虑进知识这个要素,知识凝聚了人类积累的智慧。过去十几年,我们都是从数据驱动的角度来研究人工智能,现在可能是时候把数据驱动和知识驱动结合起来了。
P5 周志华:“数据、算法、算力”,人工智能三要素在未来还要加上“知识”相关推荐
- 周志华:“数据、算法、算力”,人工智能三要素在未来还要加上“知识”
点击蓝字 关注我们 作者丨李雨晨 来源丨AI科评论 2020 年 8 月 7 日,全球人工智能和机器人峰会(CCF-GAIR 2020)正式开幕.CCF-GAIR 2020 峰会由中国计算机学会(C ...
- 周志华:“数据、算法、算力”人工智能三要素,在未来还要加上“知识”
点击上方,选择星标或置顶,不定期资源大放送! 阅读大概需要15分钟 Follow小博主,每天更新前沿干货 来源:AI科技评论 作者:李雨晨 2020 年 8 月 7 日,全球人工智能和机器人峰会(CC ...
- 周志华:“数据、算法、算力”人工智能三要素,在未来要加上“知识”| CCF-GAIR 2020...
来源:雷锋网 作者 | 李雨晨 如何将"机器学习"与"逻辑推理"相结合,是人工智能领域的"圣杯问题" " 编者按:2020 年 8 ...
- 周志华:“数据、算法、算力” 人工智能三要素,在未来要加上“知识”!
干货 分享人:周志华教授,来源:AI科技评论 作者:李雨晨 编辑:丛末 在CCF-GAIR 2020 的人工智能前沿专场上,南京大学计算机系主任.人工智能学院院长.CCF会士.ACM.AAAI.I ...
- 牛人(周志华)推荐的人工智能网站
牛人(周志华)推荐的人工智能网站 分类: 机器学习(4) 版权声明:本文为博主原创文章,未经博主允许不得转载. 转载自周志华老师个人主页:http://cs.nju.edu.cn/zhouzh/z ...
- 【吃瓜教程】周志华机器学习西瓜书第三章答案
线性模型结构梳理 3.1 试析在什么情形下式3.2中不必考虑偏置项b 答案一: 偏置项b在数值上代表了自变量取0时,因变量的取值: 1.当讨论变量x对结果y的影响,不用考虑b: 2.可以用变量归一化( ...
- 周志华-机器学习西瓜书-第三章习题3.3 编程实现对率回归
本文为周志华机器学习西瓜书第三章课后习题3.3答案,编程实现对率回归,数据集为书本第89页的数据 使用tensorflow实现过程 # coding=utf-8 import tensorflow a ...
- 《机器学习》周志华课后习题答案——第三章 (1-7题)
<机器学习>周志华课后习题答案--第三章 (1-7题) 文章目录 <机器学习>周志华课后习题答案--第三章 (1-7题) 一.试析在什么情形下式(3.2)中不必考虑偏置项b. ...
- Tom Mitchell、杨强、周志华共话算法未来,世界人工智能大会算法峰会报名中
算法一直是推动人工智能技术跃迁的关键.当前,产业界的需求.数据的红利,为人工智能的发展提供了最佳时机,同样也对算法提出了新的要求.如何揭开深度学习"黑箱"?下一个引领AI的算法是什 ...
最新文章
- CodeForces 362C
- 127 - Accordian Patience
- Android Lifecycle 生命周期组件详解
- 全套Python数据分析常用命令速查表!PDF文档限时分享
- Win10 Build 11099和11102的更动超过1200项
- Java初始化顺序研究
- SpringBoot之打包错误
- 如何七周成为数据分析师
- 优秀的程序员是这样的
- 4行代码,Python玩转美图秀秀
- finereport java无符合资料_Java报表工具FineReport常见的数据集报错错误代码和解释...
- 关于VMware增强型键盘驱动程序
- 学生管理系统测试用例
- linux opendir路径_Linux下目录文件的操作(opendir,readdir,closedir) 以及DIR,dirent,stat等结构体详解...
- 省市级联实现,并根据IP自动获取省市
- 用微PE安装KALI LINUX到U盘,【U盘安装kali】U盘 kali pe三合一教程!装机,存储
- elasticsearch 使用词干提取器处理英语语言
- 床帘机器人_如何打造一个更舒适更智能的大学宿舍?
- 程序员约架事件中,薛非为何不应战?
- 微信小程序 - video组件poster无效 / 视频播放列表
热门文章
- h3c服务器显示非法的文件,H3C License server 故障处理手册-5W201
- cass插件_第009期分享:Cass插件合集
- python二叉树遍历例子_python数据结构之二叉树的遍历实例
- python argv 详解_详解sys.argv[]的使用方法
- python format 时间格式
- 图论:二分图多重匹配
- 第4.17章读书笔记
- 自学Python八 爬虫大坑之网页乱码
- MyEclipse6.5设置
- LeetCode(169)——求众数(JavaScript)