前言

由于研究方向的缘故接触到了Judea Pearl老爷子的这本书,其中一些极具启发性的内容,让我感觉到即使不用于学术研究,对日常生活或许也有所裨益。书籍的写作虽尽量做到通俗,但由于内容稍有门槛,却也不能说是易懂,为了更好地吸收这些知识,遂以阅读笔记的形式记录下来。

本书的内容将会围绕着一门新科学展开,它的名字是“因果推断(causal inference)”。

在这个大数据、深度学习所主导的强人工智能时代,以数据为中心的观念深入人心,仿佛只要有充足的数据便足以解决所有问题。

目前自然语言处理领域愈发巨大的预训练模型,便是这种观念的一种具象化。爆炸式增长的参数量,超大规模的语料,然而 数据真的是万能的吗?

数据可以告诉我们服药的病人比不服药的病人康复得更快,但是却不能告诉我们为什么会这样。或许,服药的人选择吃这种药是因为他们支付得起,即使不服用这种药,照样能恢复得这么快。

因果关系,是我们认知世界的一种重要方式,模型仅仅依靠海量数据真的可以像人类一样去理解世界吗?对此我持怀疑态度。

这也是本书作者想要强调的为什么因果关系如此重要的原因,所谓“思维胜于数据”,利用数据终究只是找规律,真正重要的是其背后的思维。

关于因果的数学语言

作者认为,阻碍因果推断这一科学诞生的最大障碍,是我们用以提出因果问题的词汇和我们用以交流科学理论的传统词汇之间的鸿沟。

比如,气压计读数B与实际大气压P的关系可以用方程式B=kPB=kPB=kP表示。三个变量中的任意一个在数学上都没有凌驾于其他两个之上的特权。那么我们该如何表达“大气压的变化导致气压计读数的变化”这一确凿的事实?这正是科学家们在尝试表达一些明显的因果关系时所面临的困难。

每一门蒸蒸日上的科学都是在其符号系统的基础上繁荣发展起来的。

此前的我们无法在科学的范围内找到途径明确地表述这些因果关系,没法用数学与公式去描述这些显而易见的事实。

因果推断这门新科学的贡献就在于催生出了一种简单的数学语言,用以表达我们已知和欲知的因果关系

因果关系演算法

因果推断的数学工具名为“因果关系演算法”,其由两种语言组成。

  • 其一为因果图(causal diagrams),用以表达我们已知的事物。

因果图并非唯一的因果模型,这些因果模型都用于描述在环境中控制并塑造数据生成的因果力量(描述出数据的生成过程)。

  • 其二为类似代数的符号语言,用以表达我们想知道的事物。

这种符号式的问题语言,用于表述想要回答的问题。例如,如果想要知道药物D对病人生存期L的影响,可以写作P(L∣do(D))P(L | do(D))P(L∣do(D)),此处的do算子表明我们正在进行主动干预而非被动观察,这一概念是经典统计学所无法涉及的。

这里所调用的干预算子do(D)do(D)do(D),确保观察到的病人存活期L的变化能完全归因于药物本身,而没有混杂其他影响寿命长短的因素。

在数学上,自愿服药的病人生存期L的观测频率记作P(L∣D)P(L | D)P(L∣D),这就是统计学教科书中常用的条件概率。但观察到(seeing)与进行干预(doing)有着本质的区别,它解释了我们不认为气压计读数下降是风暴来临的原因。观察到气压计读数下降意味着风暴来临的概率增加,但人为迫使气压计读数下降对风暴来临的概率并不会产生影响。

作者再次强调,对观察和干预的混淆是悖论之源

因果革命最重要的成果之一就是解释了如何在不实际实施干预的情况下预测干预的效果:定义do算子以便提出正确的问题;使用一种无需实际实施干预便可模拟干预行动的表达方式,这种表达方式是因果推断科学独有的,称为"反事实"(counterfactual)。

作者在20世纪80年代时意识到,妨碍机器发展出相当于人类水平的智能的最大障碍,可能是缺乏对因果关系的理解。这也成为了他研究因果关系的一大动力。

因果推断引擎

作者在这部分提出来了一个因果推断引擎的蓝图,描述了人工智能进行因果推理的过程。

由于这是一个些许复杂的流程,且涉及很多必要的说明,此处便不再复述,只摘取对我有启发意义的部分语句。

关于数据的一个真相:数据永远是从理论上无限的总体中抽取的有限样本

而深度学习的目标便是从有限的样本泛化到无限的总体。

作者认为,对于因果关系方面的知识来说,数据没有任何发言权。有关行动或干预结果的信息根本无法从原始数据中获得,这些信息只能从对照实验操作中收集。

因果模型所具备,而数据挖掘和深度学习所缺乏的另一个优势是 适应性,被估量是在检查数据特性之前仅仅根据因果模型计算出来的,无论变量之间的数值关系如何,都适用于与定性模型适配的数据。

以上,便是我对本书导言部分的摘录+个人总结。

个人认为,在深度学习中,我们设计模型、算法等均是一个融入人类先验知识的过程,我们让模型在一定先验知识的辅佐下从数据中发现规律,解决问题。比如由于语言变长序列的特性,我们使用RNN而不是CNN处理语言。但是这种先验知识强度有限,无法囊括我们对世界的所有认知。

而因果关系作为我们认知世界最重要的方式之一,很多时候单从数据上难以挖掘得到。这时候便会很自然的想到将因果关系使用数学语言表达,作为一种更强的先验知识融入到深度学习模型之中,这极有可能是迈向强人工智能的重要阶梯。

『The Book of Why』导言:思维胜于数据相关推荐

  1. 百度文心大模型开发者斩获CCF BDCI大赛唯一『最佳算法能力奖』

    ‍2023年2月24日至25日,中国计算机学会(CCF)主办.苏州市吴江区人民政府支持,苏州市吴江区工信局.吴江区东太湖度假区管理办公室.苏州市吴江区科技局.CCF大数据专家委员会及其他专业委员会等多 ...

  2. 『极简学习法』大多公司更喜欢能够高效学习的学生——赶紧点进来

    『极简学习法』 前言:学会三步走学习法,以后你学习任何知识能不成问题,先预祝你一切顺利哦!坚持坚持坚持! 要是你的心本来就在燃烧,那么一旦需要,掏出来就是火把. 第一:精准输入 One:学准:倒推思维 ...

  3. Day03『NLP打卡营』实践课3:使用预训练模型实现快递单信息抽取

    Day03 词法分析作业辅导 本教程旨在辅导同学如何完成 AI Studio课程--『NLP打卡营』实践课3:使用预训练模型实现快递单信息抽取 课后作业. 1. 更换预训练模型 在PaddleNLP ...

  4. day01『NLP打卡营』实践课1:词向量应用演示

    Day01 词向量作业辅导 本教程旨在辅导同学如何完成 AI Studio课程--『NLP打卡营』实践课1:词向量应用展示 课后作业. 1. 选择词向量预训练模型 在PaddleNLP 中文Embed ...

  5. 『遥かに仰ぎ、丽しの』游戏初回版特典原声集 GAME SP OST(下载、中日双语歌词)...

    记得苍月的结局音乐和内容一样很棒. 大师就给大家送上遥かに仰ぎ.丽しの GAME SP OST 本期策划:大师♂罗莊 翻译:天界白魔导 为什么网上已经有翻译,大师还要组织翻译歌词呢呢? 同学,这个翻译 ...

  6. 射手科技公开课第一辑 『项目管理和代码规范』

    射手玩的东西越来越全面了,从当年的字幕下载站,到播放器,到射手科技,发展的思路值得借鉴和思考. 射手科技成立3个月以来,我们内部已经组织了不少培训.每次内部培训我们都留有录像和录音,以便后续参与项目的 ...

  7. MuPlayer『百度音乐播放内核』

    MuPlayer『百度音乐播放内核』 -- 跨平台.轻量级的音频播放解决方案. 多端(PC & WebApp)通用,统一的API调用方式 HTML5 Audio与Flash内核的平滑切换(支持 ...

  8. 『Photo Shop实用技巧』之 去除红眼

    『Photo Shop实用技巧』之 去除红眼 往往夜间拍摄或者使用闪光灯的时候会造成"红眼"的现象,现在给大家一个简单的办法去除红眼 此主题相关图片如下: 非常抱歉,我没有&quo ...

  9. [日推荐] 『KORJO母爱小空间』妈妈带宝宝出门再也不用愁啦!

    2019独角兽企业重金招聘Python工程师标准>>> 对于哺乳期妈妈们来说,带宝宝出门最大的问题就是哺乳和换尿布,虽然现在很多商场都配置了母婴室,但是走在路上,如果宝宝突然哭闹起来 ...

最新文章

  1. 一道关于call和this的JS面试题
  2. 源码包部署tomcat
  3. 产品经理的四个重要阶段
  4. 医疗卫生信息化 医学信息 医院管理 医疗信息化 资源下载
  5. Kubernetes从懵圈到熟练:认证与调度
  6. vue 在 html 中自定义 tag
  7. [Leedcode][JAVA][第990题][等式方程的可满足性][并查集]
  8. EdgeRoutine技术专家教你把JS代码跑到CDN边缘
  9. 想被千年后的人知道吗,快去GitHub上传代码吧!
  10. 数据库“意外失联”?华为云DRS异地多活灾备为您支招
  11. 【Flink】解决Flink在测试环境无法保存checkpoint问题
  12. OpenCV-双边滤波cv::bilateralFilter
  13. 炫酷而不复杂,RDP报表就是这么实用方便
  14. 【杂谈】蓝屏修复杂谈
  15. 继电器rc吸收电路取值_RC吸收电路
  16. 联合循环——13(智慧电厂的发展与展望)
  17. Git 拉取远程仓库失败
  18. 神经网络中的遗忘,遗忘的作用
  19. python读写磁盘扇区数据有什么用_18-55.在Windows中,能够自动修复文件系统错误、扫描并尝试恢复坏扇区的操作是( )_学小易找答案...
  20. CF外挂界令人发指的垃圾外挂!让你接触不为人知的内幕!

热门文章

  1. 好多大鱼的国风火车站,却有满满的科技感
  2. 互联网:常见运营术语,PV、UV、GMV、CVR等
  3. 直播:全能项目经理 - 设计篇(2015-2-16)
  4. Google搜索从入门到精通
  5. 前端自动化测试基础-sinon篇章
  6. 蓝牙BLE之系统学习
  7. python文件流_python--文件流读写
  8. 2022年CISP证书有啥用
  9. 分类计数原理与分步计数原理_分类or分步?计数原理别再傻傻分不清~
  10. 计算机网络:(终章)4万字长文,总复习