受访者 | 张坤

记者 | 夕颜

出品 | CSDN(ID:CSDNnews)

自从 AI 搭乘 AlphaGo 出道以来,关于感知智能需要向认知智能进化的讨论被提上日程,因为虽然 AlphaGo 战胜了李世石,但是为什么 AI 会赢,其中的因果关系没人知道。认知智能的理想发展路线,是从认知心理学、脑科学及人类社会历史中学习,并结合领域知识图谱、因果推理、持续学习等技术,建立稳定获取和表达知识的有效机制,让知识能够被机器理解和运用,让 AI 能够回答为什么的问题,实现从感知智能到认知智能的关键突破。

这其中的关键方法,就有我们今天要讨论的主题——因果关系。

什么是因果关系?

18 世纪,苏格兰不可知论哲学家大卫·休谟提出“因果关系是人类的错觉”(即人们所谓的因果,实质上是对“相关关系”的归纳推理,而相关性无法保证因果性),用怀疑论毁掉了因果律,否认了理性分析的作用,引发哲学危机。从此,科学家就未停下过对因果关系的争论。

爱丁堡的大卫·休谟雕像

那么,什么是因果关系?因果关系有多重要?

从定义上来说,人们对因果关系最常见的误解,是会将其与相关关系混淆。《爱上统计学》一书举例说明了两者之间的区别:在美国中西部的一个小镇,地方警察局局长发现冰淇淋消费量越多,犯罪率就越高。这个例子中,冰淇淋消费量和犯罪率是正相关的,但并不意味着冰淇凌消费的增多导致了犯罪率的上升,更不可能通过减少冰淇凌的销售来降低犯罪率。

事实上,存在某个变量同时和冰淇淋消费量、犯罪率相关,这个变量就是室外温度。当室外气温变暖,如在夏天,就会有更多犯罪(白天更长,人们多开窗口等)。而因为天气变暖,人们更享受吃冰淇凌的乐趣。相对地,在又长又黑暗的寒冬,冰淇凌的消费就减少,同时犯罪也越少。

这里,冰淇淋消费量与犯罪率只是相关关系,虽然表面上存在着一定程度上的诡异关系,但是却非因果关系。

因果关系的抽象定义是这样的——如果保持系统中其他变量都不变,只改变其中的一个变量(比如通过人工降雨来下雨),然后发现有另一个变量也随之改变(比如我们发现地上由干变湿了),那么我们就说前面一个变量(是否下雨)是后一个变量(地上是否湿)的一个原因。一个典型的因果模型可以通过直观的图模型来描述,或者通过从因到果的数学函数来刻画。

此后数百年来,自然科学和社会科学中有很多科学家在尝试针对因果关系的检测方法,比如2002 年,加州大学伯克利分校教授亨利·布雷迪撰文整理了因果推断的各种经典理论,并根据不同假设,将其分为新休谟理论、反事实理论、操控实验理论、机制理论 4 大类,而从计算视角,近年来还兴起了基于统计独立性、分布变化性、因果过程复杂度和“压缩感知”的新方法。新的方法不断出现,但万变不离其宗,并且与哲学的紧密关系不减反增,其中包括卡内基梅隆大学哲学系(并在机器学习系兼职)副教授张坤在做的事。

一个用因果思维做机器学习的科研人

在张坤看来,哲学与机器学习看似两个毫不相关的领域,但其实有着很多交集,他本人就是一个跨越两个学科的科研人。在卡内基梅隆大学,张坤是哲学系教授,同时指导机器学习系博士生,并且是德国马克思普朗克智能系统研究所高级研究员。他的主要研究方向是机器学习和人工智能,特别专注于因果发现和因果机器学习的研究。在机器学习顶级会议和期刊上,他的团队每年展示十余篇论文, 他并担任 NeurIPS、ICML、UAI 等多个顶级会议的领域主席。

为什么说两个学科之间有交集?张坤的团队希望有更好的认识论和更恰当的方式来定义和解决实际问题。哲学思维方式能让他们更在意问题如何定义以及问题本身意义何在,而机器学习的背景和思维方式让他们脚踏实地从数据出发发现新的信息并进而更新其传统认识。张坤认为,哲学与机器学习两者之间类似于思和学的关系——学而不思则罔,思而不学则殆。

张坤在中国科学技术大学读完本科,在香港中文大学计算机系获得博士学位。在读博期间,他对如何从机器学习的角度看因果关系产生了很大兴趣,于是便从机器学习领域中逐渐缩小关注范围。最终将主要研究领域聚焦于因果发现和因果思维方式的机器学习,虽然当时在机器学习领域几乎还没什么人关注因果性。

在读博期间,张坤第一次接触到机器学习相关的研究课题,当时的目的是做更好的独立成分分析的方法。做那个课题的过程中,他深刻地感觉到,做研究要么着眼于重要的待解决问题而不受领域的限制,要么着眼于重要的还未被公认完善的方法而不被应用限制。如果两者都不是,可能需要想一想自己的研究到底要做什么样的贡献。

因果关系,就是一个重要的待解决的问题,也是具有重要意义的还未有完善方法的方向。在 CMU,张坤的主要研究方向就是在各种场景下如何找出真正的因果关系,以及如果解决一系列具有数据异质性的机器学习问题。他所在的小组在这两个方向并驾齐驱,这几年在研究上取得了一系列进展,比如他们可以从观测数据中自动找出背后有相互因果关系的隐变量。在他看来,这是一次不小的进步。

在在此之前,张坤有不少因果关系相关的研究成果出来,其中最为重要的成果包括他提出的自动因果关系发现方法以及用因果的思维方式解决迁移学习等问题。总体来说,前者将就是通过机器学习的方式,分析各种各样的观测数据,以找到背后的因果关系。张坤说到,在一些假设条件下,因果关系发现其实就是机器学习问题,问题是我们需要合适的或者很弱的假设,这是因果关系和数据之间的桥梁。上世纪 90 年代初,该方向的研究曾获得很大进展,因果发现问题得到部分的解决。而在过去十几年间,机器学习的思维方式的介入更是促进了因果关系突飞猛进的变化。而用因果的思维方式解决迁移学习问题,可以帮助我们判断系统的那些信息可被迁移,以及如何迁移。

张坤介绍到,近年来,因果发现有了不少新的理论和算法,大致是围绕如何利用异构数据以及如何自动构建隐藏的因果变量,而张坤团队最近的自动构建隐变量及其之间因果关系的方法,已经被应用到一系列心理学问题上。用他的话说,“得到了全新且有意义的结果,直接帮助他们重构、理解和干预心理上事实存在的各个维度。”张坤还提到,在这类问题上,华南工业大学的蔡瑞初老师团队也做出了令人兴奋的结果。

因果关系落地难点

具体来说,因果关系下大概分两个研究领域,其一是因果发现,它可以回答“为什么”的问题;其二是有了定性因果关系后,如何确定一个变量对另一个变量的因果影响,比如,它可以帮我们确定不同治疗方式对 COVID-19 的疗效。张坤认为,因果关系的研究领域现在还应该再增加一个,就是因果智能机器学习,它可以帮我们实现更鲁棒、更具适应性、更通用的机器学习系统。

关于因果关系的基础研究范围在不断拓扎和完善,大家关心的更多的还有其在实际场景中落地有哪些进展与难度。

张坤提到,因果关系在实际场景落地的最大困难,是需要掌握和使用要解决问题的特定性质,以及熟悉哪些问题一定需要用因果的思维方式才能解决,如此才能精确、高效的找到背后的因果关系并加以适当应用。“举例来说,现实中我们测量出来的变量往往有很大噪声,甚至并不是我们真正想找的变量,系统有观测噪声这样的信息都可以帮助我们大大降低搜索空间,从而提高搜索效率并改善最终结果,”张坤表示。

因果关系研究并不完善,亟待更多人才

实际上,张坤告诉 CSDN,因果关系相关的基础研究并不完善,因为这还是一个较新的领域,很多实际问题还未得到好的解决,甚至还没有被很好地刻画出来。他认为,用非参数的方式自动构建因果隐变量会是很未来重要的方向,无论是对于单纯的因果研究领域还是机器学习领域。

Judea Pearl

有着巨大挖掘和进步空间的因果关系领域,还需要更多人才的加入。对于那些对因果关系研究感兴趣的同学,张坤推荐了一些入门书籍和资料,包括 Judea Pearl 的 Causality: Models, Reasoning, and Inference,Peter Spirtes, Clark Glymour and Richard Scheines 的 Causation,Prediction,and Search,前者注重在概念和因果影响辨识问题(假设定性的因果影响已知),后者着眼于如何从数据发现因果关系。

此外,张坤提到 Clark Glymour 和他本人正在写一本关于因果发现的书,目前还未完工,希望完成之后能为大家提供比较及时、系统的因果发现以及如何使用因果关系的素材,大家可以关注一下。

另外一个问题大家可能也会关心——学习因果关系方向需要掌握扎实的数理知识基础吗?对学生入门学习,专家有哪些建议?

对此,张坤表示入门因果关系确实需要扎实的数理知识基础,他的建议就是别怕那些概念——毕竟因果关系不仅仅是对观测数据的现象描述,它需要一个新的描述体系。把那些概念吃透,变成自己思维方式的一部分。同时多考虑一些看起来宽泛的问题,比如人为什么在意因果关系以及人如何学习因果关系。在不同阶段,我们对这类问题的回答会有不同,更好的答案会直接催生更好的学习方法,而对更好的回答的追求也会给我们源源不断的动力。

【END】

更多精彩推荐

NB-IoT 连接数过亿,开发者如何抓住新机遇?

华为云跻身Gartner报告中国三强,预示云计算市场的未来变局?

☞数据库激荡40年,深入解析PostgreSQL、NewSQL演进历程

☞黑客用上机器学习你慌不慌?这 7 种窃取数据的新手段快来认识一下!

☞超详细!一文告诉你 SparkStreaming 如何整合 Kafka !附代码可实践

☞Libra的Move语言初探,10行代码实现你第一个智能合约

你点的每个“在看”,我都认真当成了喜欢

看似毫不相干,哲学与机器学习竟有如此大的交集?相关推荐

  1. 人类至今未解六大哲学命题、世界著名十大哲学命题(回复“哲学命题”下载PDF典藏版资料) 原创: 秦陇纪 科学Sciences 今天

    人类至今未解六大哲学命题.世界著名十大哲学命题(回复"哲学命题"下载PDF典藏版资料) 原创: 秦陇纪 科学Sciences 2018-06-13今天 科学Sciences导读:人 ...

  2. 机器学习之开源库大总结

    机器学习之开源库大总结 研究数据挖掘和机器学习有一段时间了,对数据挖掘来说,商用软件有SAS.Clementine.Oracle数据挖掘组件等等:由于个人学习和版权.算法定制等问题,开源的数据挖掘与机 ...

  3. 使用Java语言开发在线电影推荐网 电影推荐系统 豆瓣电影爬虫 基于用户、物品的协同过滤推荐算法实现 SSM(Spring+SpringMVC+Mybatis)开发框架 机器学习、人工智能、大数据开发

    使用Java语言开发在线电影推荐网 电影推荐系统 豆瓣电影爬虫 基于用户.物品的协同过滤推荐算法实现 SSM(Spring+SpringMVC+Mybatis)开发框架 机器学习.人工智能.大数据开发 ...

  4. 机器学习第一章之大数据分析与机器学习简介

    大数据分析与机器学习简介 1.1 大数据分析与机器学习概述 1.1.1 大数据分析与机器学习的应用领域 1.1.2 机器学习的基本概念 1.1.3 Python在数据科学中的作用 1.2 Python ...

  5. 在线电影推荐网 使用Python+Django+Mysql开发技术 在线电影推荐系统 电影网站推荐系统 基于用户、物品的协同过滤推荐算法 个性化推荐算法开发 机器学习、人工智能、大数据分布式开发

    在线电影推荐网 使用Python+Django+Mysql开发技术 在线电影推荐系统 电影网站推荐系统 基于用户.物品的协同过滤推荐算法 个性化推荐算法开发 机器学习.人工智能.大数据分布式开发 Mo ...

  6. 第27件事 产品哲学中必须关注的9大人性

    第5章 需求分析与管理 第27件事 产品哲学中必须关注的9大人性 第28件事 挖掘用户真实需求的6大撒手锏 第29件事 评估需求的8种方法 第30件事 定义需求优先级的4种方法 第31件事 管理需求 ...

  7. 免费教材丨第58期:机器学习相关汇总资料大放送(中)

    小编说  上期为大家发放的教材为:经过整理的机器学习相关的经典书籍及经典论文,本期将继续为大家发放哦! 本期教材 本期为大家发放的教材为:经过整理的机器学习相关的教学视频和讲义,可能会跟之前的有重复, ...

  8. 监督分类:SVM即支持向量机实现遥感影像监督分类(更新:添加机器学习模型存储、大影像划框拼接)

    前面已经有一个版本了,但是影像太大内存顶不住,而且训练和预测没有分离,后面批量用这个不可能每次每张影像都训练了再预测,这次正好有需求,我就最后把这个整理一下,算是终版吧,以后也不会再花时间整这个了 这 ...

  9. 经验 | 机器学习要避开十大雷区

    点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 编辑:Sophia 转载于 :量子位 做机器学习工程师,通常都要读 ...

最新文章

  1. Java中 equals和==的区别?
  2. JEECG Framework 3.3.1 beta版本发布第一天战报(文档下载量破1300、...
  3. 【边缘检测】BDCN:Bi-Directional Cascade Network for Perceptual Edge Detection
  4. CSS文字或元素的水平垂直居中多种方式(简单明了)
  5. CNN破解简单验证码(Tensorflow实现)
  6. 【论文复现】使用fastText进行文本分类
  7. 虚拟机挂载新虚拟硬盘步骤
  8. sql as关键字_SQL AS关键字概述和示例
  9. 前端try catch是如何捕获异常的_Try-Catch无法正确定位异常位置,我推荐2个有效技巧...
  10. 关于filenet中的folder以及document简单操作
  11. 小新黑苹果声卡ID注入
  12. 是潜意识音频优于催眠
  13. 计网实验七:应用层协议服务配置(DNS,HTTP,FTP)
  14. 请写出sfr和sbit的语句格式_KEIL中的SFR和SBIT用法
  15. 《那些年啊,那些事——一个程序员的奋斗史》——119
  16. JAVA体育用品在线商城系统-springboot【数据库设计、源码、开题报告】
  17. Linux内核分析 读书笔记 (第五章)
  18. 介绍7种分析问题的思维方法
  19. ulr实现web资源下载
  20. 搜索引擎SEO发包快排原理【SEO内行解密】

热门文章

  1. 《程序是怎样跑起来的》读书笔记
  2. solr.Net课程二 solr5.5之core配置
  3. 1415-2 计科计高 软件工程博客Github地址汇总-修正版
  4. 常用正则表达式 潇湘博客
  5. 《机器学习实战》学习总结(一)KNN分类算法原理
  6. 第2章 数据库系统体系结构
  7. cnn 回归 坐标 特征图_RCNN, Fast R-CNN 与 Faster RCNN理解及改进方法
  8. 大智慧 软件 开发语言_智慧工厂培训软件开发流程篇
  9. 内镜碎石术装置行业调研报告 - 市场现状分析与发展前景预测
  10. 2021-2025年中国顶灯行业市场供需与战略研究报告