作者 | Judea Pearl,Danna Mackenzie

编辑 | Natalie

AI 前线导读: 人工智能研究专家 Judea Pearl 及其同事领导的因果关系革命突破多年的迷雾,厘清了知识的本质,确立了因果关系研究在科学探索中的核心地位,并建构了一个重要概念:因果关系之梯,其包括三个层级,其一为观察,其二为行动(干预行为),其三为想象(反事实推理),对这一概念的深入挖掘和探索,辅之以数学语言的精确表达,让我们能够回答几代科学家无法触及的研究问题,引导人工智能迈入新的高度。本文节选自《为什么:关于因果关系的新科学》一书,文末有送书福利!

更多优质内容请关注微信公众号“AI 前线”(ID:ai-front)

二十世纪八十年代初,人工智能领域走入死胡同。自 1950 年阿兰·图灵在他的论文《计算机器与智能》中第一次提出挑战以来,AI 的主导方法就是所谓的基于规则的系统或专家系统,它将人类知识组织为具体事实和一般事实的集合,并通过推理规则来连接它们。例如:苏格拉底是一个人(具体事实)。所有人都要死(一般事实)。从这个知识库我们(或一台智能机器)使用普遍推理规则可以推断出苏格拉底要死的事实:

这种方法在理论上是可行的,但是硬性规则很少能捕捉到真实生活中的知识。也许我们并没有意识到,我们一直在应对例外规则和证据的不确定性。到 1980 年,专家系统显然难以从不确定的知识中做出正确的推断。计算机无法复制人类专家的推理过程,因为专家本身无法在系统提供的语言中阐明他们的思维过程。

二十世纪七十年代末,是 AI 界处理不确定性问题的酝酿期。想法倒是不缺。伯克利大学的罗特夫·扎德 (Lotfi Zadeh) 提出了“模糊逻辑”,其中陈述既不真也不假,而是一系列可能的真实值。堪萨斯大学的格伦·谢弗提出了“信念函数”,它给每个事实分配两个概率,一个表示“可能”的概率,另一个表示“可证明”的概率。爱德华·费根鲍姆和他斯坦福大学的同事尝试了“确定性因子”,将不确定性的数值度量插入到他们推断的确定性规则中。

遗憾的是,这些方法虽然具有独创性,但却有一个共同缺陷:他们模拟专家,而不是模拟世界,因此往往产生意外的结果。例如,它们不能同在诊断和预测模式中运行,这是贝叶斯法则无可争议的优势。在确定性因子方法中,规则“若起火,则冒烟(具有确定度 )”与“若冒烟,则起火(具有确定度 )”连贯地结合在一起,肯定会引发信念的失控。

当时也考虑了概率,但因对存储空间和处理时间的要求非常高,很快就饱受诟病。我进入这个竞技场的时间相当晚,1982 年,当时我提出一个平淡无奇但又激进的建议:让我们将概率作为常识的守护者,仅仅修复它的计算缺陷,而不是从头开始再造一个新的不确定性理论。更具体地说,不是像以前那样,以一张巨大的表格来表示概率,而是用松散耦合的变量网络来表示。假设我们仅仅让每个变量与几个相邻变量相互作用,那么我们就可以克服使其他概率论者犯错的计算障碍。

这个想法并非从天而降。它来自加州大学圣地亚哥分校大卫·鲁梅哈特的一篇文章,他是认知科学家,也是神经网络的先驱。他在 1976 年发表的关于儿童阅读的文章明确指出,阅读是一个复杂的过程,同时活跃着许多不同层次的神经元(见图 3.4)。

有些神经元仅仅识别个体特征 —— 圆圈或线条。在它们之上,另一层神经元将这些形状组合在一起,形成关于字母可能是什么的猜想。图 3.4 中,网络正在为第二个单词的大量歧义而冥思苦想。

在字母层面上,它可能是“FHP”,但在词汇层面没有太大意义。在词汇层面上它可能是“FAR”或“CAR”或“FAT”。神经元将这些信息向上传递到句法层面,判断在“THE”之后,会出现一个名词。

最后,这些信息被传递到语义层面,意识到前一句提到了大众汽车,所以这个短语很可能是“THE CAR”,同指大众汽车。关键一点是,所有神经元都是来回传递信息,自上而下,自下而上,左右传递。这是一个高度并行的系统,与我们对大脑的自我认知,即它是一个单一的、集中控制的系统,完全不同。

阅读鲁梅哈特的论文时,我确信任何人工智能都必须建模在我们所知道的人类神经信息处理的基础上,并且不确定性下的机器推理必须用类似的消息传递 (message-passing) 的体系结构来构建。但是这些消息是什么呢?我花了好几个月才弄明白。我终于认识到,消息是一个方向上的条件概率和另一个方向上的似然比。

图 3.4. 大卫·鲁梅哈特的草图,消息传递网络如何学习阅读短语“THE CAR”。(来源:美国加州大学圣地亚哥分校的大脑与认知中心。)

更确切地说,我认为网络应是分层的,箭头从更高的神经元指向较低的神经元,或者从“父节点”到“子节点”。每个节点都会向所有相邻节点(包括层次结构中上方和下方)发送消息,告知当前它对所跟踪变量的信念度(例如,“我有 2/3 的把握认为这个字母是 R”)。接收的节点会根据其方向,以两种不同的方式处理消息。如果消息是从父节点到子节点,子节点将用条件概率更新它的信念,如同我们在茶室例子中见到的。如果消息从子节点到父节点,父节点将通过乘以一个似然比来更新信念,如同乳房 X 光检查的例子。

将这两条规则反复应用于网络中的每个节点称为信念传播。回想起来,这两条规则并非武断或捏造;它们严格遵守贝叶斯法则。真正的挑战是要确保无论这些消息以什么顺序发送出去,事情最终会达到一个舒适的平衡;此外,最终的平衡将代表对所有变量的信念的正确状态。我所说的“正确”,意思是,就好像我们用教科书的方法而不是通过消息传递进行了计算。

这一挑战耗费我和我的学生、同事几年的时间。但在二十世纪八十年代末,我们已经解决了这一难题,使贝叶斯网络成为机器学习的实用方案。接下来的十年,现实生活中的应用不断增加,例如垃圾邮件过滤和语音识别。然而,那时我已经尝试攀登因果关系之梯,将贝叶斯网络的概率研究委托给了其他人。

延伸阅读

在贝叶斯网络之父朱迪亚·珀尔(Judea Pearl)的眼里,深度学习,恰恰是人工“不”智能的体现,因为其研究对象是相关关系而非因果关系,处于因果关系之梯的最底层。珀尔曾在《量子杂志》采访中说到:深度学习取得的所有巨大成就在某种程度上都不过是对数据的曲线拟合而已。从数学层次的角度来看,不管你如何巧妙地操作数据,以及你在操作数据时读取的内容,它仍然是一个曲线拟合的训练过程,尽管它看起来比较复杂。

人工智能的发展在很多方面都得益于珀尔早期的研究,他却在最新著作《为什么:关于因果关系的新科学》(《The Book of Why:The New Science of Cause and Effect》)中推翻了自己,珀尔认为当前的人工智能和机器学习其实处于因果关系之梯的最低层级,只可被动地接受观测结果,考虑的是“如果我看到……会怎样”这类问题。而强人工智能,则需要实现第三层级的“反事实”推理。

戳下文进一步了解:

AI 先驱 Judea Pearl:机器人一定会有自由意志

作者简介

[美] 朱迪·珀尔 Judea Pearl

现加州大学洛杉矶分校计算机科学教授,“贝叶斯网络”之父,2011 年因创立因果推理演算法获得图灵奖,同时也是美国国家科学院院士,IEEE 智能系统名人堂第一批 10 位入选者之一。

目前已出版 3 本关于因果关系科学的经典著作,分别为《启发法》(1984)、《智能系统中的概率推理》(1988)和《因果论:模型、论证、推理 》(2009)。他还获得过多项顶级科学荣誉,包括认知科学领域的鲁梅哈特奖、物理学及技术领域的富兰克林奖章以及科学哲学领域的拉卡托斯奖。

[美] 达纳·麦肯齐 Danna Mackenzie

普林斯顿大学数学博士,自由科学记者,知名科普作家,著有《无言的宇宙》等作品,其学术论文多次收录于《科学》《新科学家》《科学美国》《探索》等重量级期刊

图灵奖得主Judea Pearl:人工智能是如何走出死胡同的?相关推荐

  1. 图灵奖得主Judea Pearl :从“贝叶斯网络之父”到“AI社区的叛徒”

    图灵奖得主Judea  Pearl,早在40多年前便通过贝叶斯网的设计,使机器实现概率推理而在人工智能领域声名大噪,并被誉为"贝叶斯网络之父",但近年却公开声称自己其实是人工智能社 ...

  2. 500页开放书搞定概率图建模,图灵奖得主Judea Pearl推荐(附链接)

    来源:机器之心 本文约1800字,建议阅读5分钟. 本文将介绍一本图模型巨著,从图.概率图.统计和因果推理带你纵览神奇的图模型. 对因果推理感兴趣的读者想必对图灵奖得主 Judea Pearl 并不陌 ...

  3. 因果推断研究获2021诺贝尔经济学奖,图灵奖得主Judea Pearl祝贺并反对

    晓查 发自 凹非寺 量子位 报道 | 公众号 QbitAI 2021年诺贝尔奖最后一个奖项公布: 加州大学伯克利分校的David Card.麻省理工学院的Joshua D. Angrist和斯坦福大学 ...

  4. 图灵奖得主Judea Pearl:从“大数据革命”到“因果革命”

    整理 | 智源社区,龚鹤扬&高亦斌 2020年6月21日,在第二届北京智源大会开幕式及全体会议上,图灵奖得主.贝叶斯网络奠基人Judea Pearl 做了名为<The New Scien ...

  5. 图灵奖得主Judea Pearl 智源大会演讲:从“大数据革命”到“因果革命”

    整理:智源社区 龚鹤扬  高亦斌 2020年6月21日,在第二届北京智源大会开幕式及全体会议上,图灵奖得主.贝叶斯网络奠基人Judea Pearl 做了名为<The New Science of ...

  6. 图灵奖得主Judea Pearl:因果推断论文本周推荐(2022.8.8)

    刚刚,图灵奖得主.因果科学之父Judea Pearl 在推特上推荐了本周值得一读的10篇近期发表的因果推断相关论文(推荐列表下载).他评价道,他看到了人们对于"公平"." ...

  7. 图灵奖得主Judea Pearl:最近值得一读的19篇因果推断论文

    近日,图灵奖得主.因果科学之父Judea Pearl 在推特上分享了一个论文集列表PDF,推荐了19篇大多近期发表.值得一读的因果推断相关文章(推荐列表下载),同时特别highlight了一下&quo ...

  8. 图灵奖得主Judea Pearl谈机器学习:不能只靠数据

    研究机器学习,既要数据拟合,也要能解释数据. 在当前的人工智能研究社区,以数据为中心的方法占据了绝对的主导地位,并且这类方法也确实成就非凡,为语音识别.计算机视觉和自然语言处理等重要任务都带来了突破性 ...

  9. 这可能是今年最硬核的AI交流会,李飞飞、图灵奖得主Pearl等共同探讨AI未来

    点击上方,选择星标或置顶,不定期资源大放送! 阅读大概需要15分钟 Follow小博主,每天更新前沿干货 转载自:量子位 一年前,常批评深度学习的Gary Marcus与深度学习三巨头之一的Yoshu ...

最新文章

  1. java curl json_curl javaSSm框架中传入json数组的格式方法
  2. 2021年春季学期-信号与系统-第七次作业参考答案-第九小题
  3. 元素水平垂直居中的几种常用方法
  4. Oracle11g rac监听,关于oracle11g RAC 监听器使用中出现的no services以及no listener分析...
  5. python 求系数矩阵,关于numpy:python-如何在数据矩阵中使用nans计算相关矩阵
  6. windows下在一台电脑上配置多个git账号
  7. c语言fun函数yx,C语言解24点游戏程序
  8. springboot公共模块打包_SpringBoot 整合篇
  9. php 许愿墙 阶段案例_文化墙制作要突出企业哪些重点?
  10. java死信队列_Spring Boot系列教程之死信队列详解
  11. 为参加脱欧协议表决 英国工党女议员将延后剖腹产
  12. JS生成二维码,以下介绍3种方法
  13. 支持的SUPL服务器,AGPS SUPL服务器客制化
  14. PreparedStatement 批处理
  15. 【林林js笔记】克隆数组的几种方法以及浅克隆深克隆误区
  16. python3.7爬虫
  17. 伺服驱动器在机器人上的研究与应用
  18. 小米路由器AX3600开启ssh
  19. Sublime Text 3 、WebStorm配置护眼主题(浅绿色)
  20. For-For循环嵌套(大圈套小圈思想)

热门文章

  1. 基于朴素贝叶斯的垃圾分类算法(Python实现)
  2. 学习编译原理对下面这段java跳不出死循环大概能有较好的解释吧
  3. pandas中的reset_index()
  4. Nature发表新研究,用“光”加速人工智能 | AI日报
  5. 我敢打赌,这是98%的程序员都想挑战的算法趣题!
  6. 使用jQuery和YQL,以Ajax方式加载外部内容
  7. 《Flex 3权威指南》——Adobe官方培训教材
  8. 04-VTK可视化管线(1)
  9. 首次发现:你的大脑“指纹”,全球独一份
  10. 数据蒋堂 | 为什么我们需要C程序员