从“大数据时代和机器学习热潮”到“第二次因果革命”,从以数据为中心到数据理解的转变不仅涉及技术上的转变,还意味着更加深刻的范式转换。

因果关系理论与现有机器学习系统的结合,已经开拓了机器学习领域的新思想和新途径。第二次因果革命即将到来?因果推断会是下一个AI热潮吗?一场席卷各个研究领域的“因果革命”正在发生,涉及领域:统计学、基因学、社会科学、经济学、人口学、医疗健康科学、心理学、计算机科学、人工智能科学……

在大数据时代中需要突破“所有知识都来自数据关联”这一框架,亟需因果关系范式融合领域知识、常识约束的问题研究,本书就描述了这样一种体系,介绍了因果关系分析和推断的思想和方法,其中包括do-操作、反事实、原因的充分性与必要性、特异原因、实际原因等内容。“因果性的研究经历了一次重要的转变:从一个被神秘面纱笼罩的概念转变为一个具有明确语义和逻辑基础的数学对象。”在下一个十年里,这个框架将与现有的机器学习系统相结合,从而可能引发“第二次因果革命”。本书第1版曾获2001年拉卡托斯奖,作者朱迪亚·珀尔是2011年图灵奖得主。本书的出版将有利于中国的广大学者、学生和各领域研究人员了解和掌握因果模型、推理和推断相关的内容,在相关领域做出优异的成果。

本书内容

本书全面阐述了现代因果关系分析,展示了因果关系如何从一个模糊的概念发展成为一套数学理论,并广泛用于统计学、人工智能、经济学、哲学、认知科学、卫生科学和社会学等领域。本书提出了一个全面的因果关系理论,它统一了因果关系的概率、操作、反事实和结构方法,并提供了简单的数学工具来研究因果关系和统计关联之间的关系。本书通过融合领域知识、常识约束、文化传承的概念等来补充数据信息,为基于统计的机器学习中遇到的基本问题提供了科学的解决方案。

本书作者

朱迪亚·珀尔(Judea Pearl) 美国国家科学院院士,美国国家工程院院士,美国人工智能协会创始会士,加州大学洛杉矶分校计算机科学和统计学教授,IEEE智能系统名人堂第一批十位入选者之一,被誉为“贝叶斯网络之父”。2011年,Pearl因其在人工智能领域的基础性贡献荣获图灵奖。他提出的概率和因果性推理演算法,彻底改变了人工智能最初基于规则和逻辑的方向。Pearl曾获多项顶级科学荣誉,包括认知科学领域的鲁梅哈特奖、物理学及技术领域的富兰克林奖章以及科学哲学领域的拉卡托斯奖。

本书译者

刘礼  重庆大学教授,博士生导师。获巴黎十一大学博士学位,重庆市高层次人才,一直致力于从事因果学习及其应用研究,主持项目20余项,发表论文100余篇,授权专利近10项,获省部级二等奖1项,入选2022年度AI2000人工智能最具影响力学者。

杨矫云  合肥工业大学副教授,兼任中国计算机学会理论计算机科学专业委员会委员。研究方向包括因果学习、健康数据分析等,主持国家自然科学基金面上项目和青年项目、安徽省重点研究与开发计划等项目10余项,以第一发明人授权中国发明专利4项,美国发明专利2项,出版译著1部,获安徽省教学成果奖二等奖一项(排名1)。

廖军  重庆大学讲师,主要研究方向为因果知识发现、大数据分析技术及其在各领域的应用,主研国家自然基金项目、国家重点研发项目、重庆市重点基金项目近10项,发表SCI期刊及CCF会议论文20余篇,获得华夏(省部级)二等奖一项,主编《大数据基础教程》教材1本。

李廉  合肥工业大学教授,2013-2018年任教育部高等学校大学计算机课程教学指导委员会主任,2014-2019任中国计算机学会理论计算机科学专业委员会主任。获中国计算机学会2020年度“杰出教育奖”。主要从事大数据分析、机器学习、计算智能等领域的研究。获安徽省教学成果一等奖两项,国家教学成果二等奖一项。

大咖推荐

朱迪亚·珀尔的书在没有超出基本概论的前提下,提供了关于因果模型和因果推断的引人入胜的导览,这些新的研究工作是以他为核心的。由于他与其他一些人的努力,因果概念思想和应用的“文艺复兴”已经开始。
——Patrick Suppes  斯坦福大学语言与信息研究中心教授,美国国家科学院院士曾任美国哲学学会主席

朱迪亚·珀尔对统计学和因果关系的研究充满热情和创造力。他的作品总是发人深省,值得仔细研究。这本书也不例外……一次又一次,我发现自己既不同意他的假设,也不同意他的结论,但我也对自己认为已经很了解的问题有了新的见识,这让我着迷。这本书说明了珀尔对于统计文献以及对于因果推断模型的共同理解所做出的巨大贡献。
——Stephen Fienber  卡内基·梅隆大学统计学和社会科学系Maurice Falk教授美国国家科学院院士,曾任国际数理统计学会主席

朱迪亚·珀尔的这本书对于人工智能、统计学、经济学、流行病学、哲学的研究者,以及所有对于因果性基本概念感兴趣的人来说都是十分珍贵的,它将会被证明是未来十年最具影响力的书之一。
——Joseph Halper   康奈尔大学计算机科学系教授,美国国家工程院院士

知其然且知其所以然是人类智能重要体现,本书从模型、算法和推理等方面讲解因果,是一本不可多得的好书。
——吴飞  浙江大学教授,浙江大学人工智能研究所所长国家杰出青年科学基金获得者

该书是图灵奖获得者朱迪亚·珀尔教授关于因果网络模型的开创性著作,它影响了人工智能、统计学乃至哲学等自然科学和社会科学的各个领域。刘礼教授等精心翻译了这本因果推断的巨著,相信将对我国因果推断的研究起到重要的推动作用。
——耿直  北京大学教授,北京生物医学统计与数据管理研究会理事长国家杰出青年科学基金获得者

这是一本超重量级的研究著作,即便是对于专门从事人工智能、数据科学方面的研究学者、技术人员或者学生而言,如果以前从未接触过因果模型、推理与推断,那么该书会激起他们对当前人工智能发展现状的反思和对未来人工智能发展方向的探索。
——蔡瑞初  广东工业大学教授,国家优秀青年科学基金获得者

目录

上拉下滑查看目录 ↓

中文版序

推荐者序

译者序

我为什么写这本书:回顾与期望

第2版前言

第1版前言

第1章 概率、图及因果模型1

1.1 概率论概述1

1.1.1 为什么学习概率1

1.1.2 概率论的基本概念2

1.1.3 预测支持与诊断支持结合7

1.1.4 随机变量与期望8

1.1.5 条件独立与图11

1.2 图与概率12

1.2.1 图的符号与术语12

1.2.2 贝叶斯网络13

1.2.3 d-分离准则17

1.2.4 贝叶斯网络推断20

1.3 因果贝叶斯网络22

1.3.1 用于干预谕言的因果网络23

1.3.2 因果关系及其稳定性25

1.4 函数因果模型27

1.4.1 结构方程28

1.4.2 因果模型中的概率预测31

1.4.3 函数模型中的干预与因果效应33

1.4.4 函数模型中的反事实34

1.5 因果与统计术语40

第2章 因果关系推断理论43

2.1 简介:基本直觉44

2.2 因果发现框架46

2.3 模型偏好(奥卡姆剃刀原则)47

2.4 稳定分布51

2.5 获取DAG结构52

2.6 重建潜在结构54

2.7 因果关系推断的局部准则57

2.8 非时间因果与统计时间61

2.9 结论63

2.9.1 关于极小性、马尔可夫性和稳定性64

第3章 因果图与因果效应识别69

3.1 简介70

3.2 马尔可夫模型中的干预72

3.2.1 作为干预模型的图72

3.2.2 干预作为变量75

3.2.3 计算干预效应76

3.2.4 因果量值的识别81

3.3 控制混杂偏差83

3.3.1 后门准则83

3.3.2 前门准则86

3.3.3 实例:吸烟与基因型理论88

3.4 干预的计算90

3.4.1 符号预备90

3.4.2 推断规则90

3.4.3 因果效应的符号推导:一个实例92

3.4.4 基于替代试验的因果推断94

3.5 可识别性的图模型检验95

3.5.1 识别模型97

3.5.2 非识别模型99

3.6 讨论100

3.6.1 要求与扩展100

3.6.2 图作为一种数学语言102

3.6.3 从图转换到潜在结果104

3.6.4 与Robins的G-估计的关系108

第4章 行动、计划和直接效应114

4.1 简介115

4.1.1 行动、动作和概率115

4.1.2 决策分析中的行动118

4.1.3 行动和反事实120

4.2 条件行动与随机策略121

4.3 什么时候行动的结果是可识别的122

4.3.1 基于图的识别条件122

4.3.2 识别效率124

4.3.3 对控制问题解析解的推导126

4.3.4 总结126

4.4 动态计划的可识别性127

4.4.1 动机127

4.4.2 识别计划:符号和假设129

4.4.3 识别计划:序贯后门准则130

4.4.4 识别计划:计算流程133

4.5 直接效应和间接效应136

4.5.1 直接效应与总效应136

4.5.2 直接效应、定义和识别137

4.5.3 案例:大学录取中的性别歧视问题138

4.5.4 自然直接效应141

4.5.5 间接效应与中介公式142

第5章 社会学和经济学中的因果关系与结构模型144

5.1 简介145

5.1.1 寻找因果语言145

5.1.2 SEM:它的意义怎么变模糊了146

5.1.3 图作为一种数学语言150

5.2 图与模型检验151

5.2.1 结构模型的可检验性含义152

5.2.2 检验可检验性156

5.2.3 模型等价性157

5.3 图与可识别性161

5.3.1 线性模型中的参数识别161

5.3.2 与非参数识别的比较167

5.3.3 因果效应:SEM的干预解释169

5.4 部分概念基础172

5.4.1 结构参数真实意味着什么172

5.4.2 效应分解的解释177

5.4.3 外生性、超外生性及其他话题178

5.5 结论183

5.6 第2版附言184

5.6.1 计量经济学的觉醒184

5.6.2 线性模型的识别问题185

5.6.3 因果论断的鲁棒性185

第6章 辛普森悖论、混杂与可压缩性187

6.1 剖析辛普森悖论188

6.1.1 一个有关悖论的示例188

6.1.2 统计学中苦恼的事情190

6.1.3 因果关系与可交换性192

6.1.4 悖论已解决(或者,人是什么类型的机器)195

6.2 为什么没有关于混杂的统计检验,为什么许多人认为应该有,为什么他们是正确的197

6.2.1 简介197

6.2.2 因果定义和关联定义199

6.3 关联性准则如何失效200

6.3.1 凭借边缘化使充分性失效200

6.3.2 凭借封闭世界假定使充分性失效201

6.3.3 凭借无益代理使必要性失效201

6.3.4 凭借偶然抵消使必要性失效203

6.4 稳定无偏与偶然无偏204

6.4.1 动机204

6.4.2 形式化定义206

6.4.3 稳定无混杂的运算检验207

6.5 混杂、可压缩性和可交换性208

6.5.1 混杂与可压缩性208

6.5.2 混杂与混杂因子210

6.5.3 可交换性与混杂结构分析212

6.6 结论215

第7章 结构化反事实的逻辑217

7.1 结构模型语义学218

7.1.1 定义:因果模型、行动与反事实219

7.1.2 评估反事实:确定性分析223

7.1.3 评估反事实:概率分析228

7.1.4 孪生网络法230

7.2 结构模型的应用与解释231

7.2.1 线性经济计量模型政策分析:示例231

7.2.2 反事实的实证性内容 234

7.2.3 因果解释、表达及其理解238

7.2.4 从机制到行动再到因果240

7.2.5 Simon因果顺序243

7.3 公理刻画246

7.3.1 结构反事实的公理246

7.3.2 反事实逻辑中的因果效应:示例249

7.3.3 因果相关性公理252

7.4 基于结构化和相似性的反事实256

7.4.1 与Lewis反事实的关系256

7.4.2 公理系统的比较258

7.4.3 成像与条件260

7.4.4 与Neyman-Rubin框架的关系262

7.4.5 外生性和工具变量:反事实定义和图模型定义264

7.5 结构因果与概率因果267

7.5.1 对时序的依赖性268

7.5.2 死循环风险269

7.5.3 与孩子们一起挑战封闭世界假定271

7.5.4 特例因果与一般因果272

7.5.5 总结275

第8章 不完美实验:边界效应和反事实277

8.1 简介278

8.1.1 不完美与间接实验278

8.1.2 不依从性与治疗意愿279

8.2 利用工具变量界定因果效应的范围280

8.2.1 问题的形式化表述:约束优化280

8.2.2 正则划分:有限响应变量的演化282

8.2.3 线性规划公式284

8.2.4 自然边界286

8.2.5 对于处理(治疗)者的处理效应(ETT)287

8.2.6 示例:消胆胺的作用288

8.3 反事实和法律责任289

8.4 工具变量测试291

8.5 解决不依从性的一种贝叶斯方法293

8.5.1 贝叶斯方法和吉布斯采样293

8.5.2 样本量和先验分布的效应295

8.5.3 从不完全依从的临床数据中估计因果效应296

8.5.4 特例事件因果关系的贝叶斯估计298

8.6 结论299

第9章 因果关系概率:解释和识别300

9.1 简介301

9.2 充分必要原因:识别条件303

9.2.1 定义、符号和基本关系303

9.2.2 外生性下的界限与基本关系306

9.2.3 单调性和外生性下的可识别性309

9.2.4 单调性和非外生性下的可识别性311

9.3 实例与应用314

9.3.1 实例1:公平硬币下注314

9.3.2 实例2:刑法执行316

9.3.3 实例3:辐射对白血病的影响317

9.3.4 实例4:来自实验数据和非实验数据的法律责任320

9.3.5 结果总结321

9.4 非单调模型的可识别性322

9.5 结论325

第10章 实际原因327

10.1 引言:必要因果关系的不充分性328

10.1.1 重新探讨特例原因 328

10.1.2 抢占和结构信息的作用329

10.1.3 过度确定和准依赖性331

10.1.4 Mackie的INUS条件332

10.2 产生、依赖和维持334

10.3 因果束和基于维持的因果关系337

10.3.1 因果束:定义及其含义337

10.3.2 实例:从析取式到通用公式340

10.3.3 束、抢占以及特例事件因果关系的概率342

10.3.4 路径切换因果关系344

10.3.5 时序抢占345

10.4 结论347

第11章 对读者的回应、阐述和讨论351

11.1 因果、统计和图的术语351

11.1.1 区分因果和统计是必要的吗351

11.1.2 无须担心的d-分离(第1章)355

11.2 逆转统计时间(第2章)358

11.3 估计因果效应359

11.3.1 后门准则背后的直观理解(第3章)359

11.3.2 揭开神秘的“强可忽略性”362

11.3.3 后门准则的另一种证明365

11.3.4 协变量选择中的数据与知识368

11.3.5 理解倾向得分370

11.3.6 do-算子背后的直观性374

11.3.7 G-估计的有效性374

11.4 策略评估与do-操作376

11.4.1 识别附条件计划(4.2节)376

11.4.2 间接效应的意义378

11.4.3 do(x)能够表示实际实验吗380

11.4.4 do(x)操作是通用的吗381

11.4.5 没有操纵的因果关系384

11.4.6 与Cartwright一起追猎原因385

11.4.7 非模块化的错觉387

11.5 线性结构模型中的因果分析389

11.5.1 参数识别的一般准则(第5章)389

11.5.2 结构系数的因果解释390

11.5.3 为SEM(或者SEM救生包)的因果解释辩护392

11.5.4 今天的经济学模型在哪里—与Heckman一起追求原因398

11.5.5 外部变化与外科手术401

11.6 决策与混杂(第6章)405

11.6.1 辛普森悖论与决策树405

11.6.2 时间信息对于决策树是充分的吗407

11.6.3 Lindley关于因果性、决策树和贝叶斯主义的理解409

11.6.4 为什么混杂不是一个统计学概念412

11.7 反事实的演算414

11.7.1 线性系统中的反事实414

11.7.2 反事实的意义417

11.7.3 反事实的d-分离420

11.8 工具变量与不依从性421

11.9 更多关于因果关系的概率422

11.9.1 “有罪的概率为1”有可能吗422

11.9.2 收紧因果关系的概率界限424

后记:因果的艺术与科学427

参考文献462

索引488

扫码关注【华章计算机】视频号

每天来听华章哥讲书

更多精彩回顾

书讯 | 5月书讯(上)|  元宇宙、因果推断、薛定谔方程...你关注的都在这

书讯 | 5月书讯(下)|设计致物系列+少儿编程好书推荐

资讯 | 分布式系统一致性的本质,看这篇秒懂

书单 | 知乎高赞:有哪些你看了以后大呼过瘾的数据分析书?

干货 | Go语言精进之路:你知道什么是Go语言编程思维吗?

收藏 | 终于有人把Scrapy爬虫框架讲明白了

上新 | Verilog HDL与FPGA数字系统设计第2版

赠书 | 【第102期】传统企业如何应对数字化转型?这些书给你答案

干货 | 为什么每一名程序员都应该学习 C++?

干货 | 如果机器翻译始终存在缺陷和错误,那它还有什么用处?

点击阅读全文购买

因果推断会是下一个AI热潮吗?朱迪亚•珀尔新作《因果论》重磅上市!相关推荐

  1. 继中美之后,欧盟会成为下一个 AI 超级体吗?

    美国和中国已经是毋庸置疑的AI超级体了,那么欧盟有可能成为下一个吗? 德国总理安格拉·默克尔以冷酷无情著称,但需要的时候她也可以很幽默. 在最近一次由科技杂志<Ada>举办的季度会议上,有 ...

  2. 博弈游戏 ai JAVA_四国军棋是比较全面的下一个AI博弈游戏

    中国象棋和国际象棋程序,采用的都是α-β剪枝方法,但对于围棋来说,这个方法并 不适用,其主要问题是围棋的局面评估不好计算.后来蒙特卡洛方法的引入对于围棋 来说一次突破,通过模拟的方法对局面进行评估,使 ...

  3. 知识图谱升温之势已现,不要错失下一个AI风口

    近年来,随着大家对高级认知能力的积极探索,知识图谱因为表达能力强,扩展性好,并能兼顾人类认知与机器自动处理,引起了学术界.工业界以及政府部门的高度关注. 最先被大家熟知的应用领域应属搜索引擎,为了让用 ...

  4. 曝贾扬清第二跳,加入阿里!达摩院或将承载中国下一个AI愿景?

    整理 | Jane 出品 | AI科技大本营(公众号id:rgznai100) 无论是国外还是国内,AI 界的人才动向一直是大家关注的焦点,从 2017 年3 月,吴恩达离职百度,开启创业之路:201 ...

  5. 下一个AI领域的高薪方向:强化学习与智能决策研究班2023年春季招生启事

     世界繁花盛开 我们不必在同一个地方反复死磕  强化学习是最近5年来人工智能最令人激动的研究领域.如下图Google的搜索指数可以看到,强化学习的搜索指数最近一些年明显呈现增长趋势,而NLP(自然语言 ...

  6. 五大创新型AI软件公司,下一个AI独角兽就是你

    本文转载自公众号"读芯术"(ID:AI_Discovery) 商业领域的AI热词频出,以至于很多时候我们忘记了机器学习只是达成目的的手段,而非目的本身.对大多数公司而言,其真正的目 ...

  7. 五大创新型AI软件公司,下一个AI独角兽就是你!

    全文共2867字,预计学习时长8分钟 图源:knowledg 商业领域的AI热词频出,以至于很多时候我们忘记了机器学习只是达成目的的手段,而非目的本身.对大多数公司而言,其真正的目标并非创建AI,而是 ...

  8. AIGC:AI视频是下一个AI绘画吗?

    AIGC领域最近成为了人工智能领域的焦点,AI绘画的应用更是让2022年被称为"AI绘画元年",但与此同时,我们可以考虑AIGC领域的进一步应用,AIGC视频生成. 目前我国为PG ...

  9. 5月上新(上)丨元宇宙、因果推断、薛定谔方程...你关注的都在这

    华章科技上新啦! 快来看 pick  你最喜欢的新书吧~ 参与文末赠书活动,好书就要抢先读 - 新书速览 - 1.<因果论:模型.推理和推断(原书第2版)> 2.<元宇宙大爆炸:产业 ...

最新文章

  1. BCH实用场景增加,Bitwage推出BCH工资单
  2. Linux服务源码安装后开机自启动04-php-fpm
  3. sis防屏蔽程序是什么意思_Android 11将强制应用程序支持本地备份——什么意思?...
  4. JavaSE基础知识(5)—面向对象(Object类)
  5. mysql5717开发设置怎么调回来_华为手机这几个默认设置,一定要关闭,再也不卡顿...
  6. 详解Oracle DELETE和TRUNCATE 的区别
  7. [css] 请使用css3来模拟中/英文打字的效果
  8. git 修改commit_Git从8到13 深入了解Git特性
  9. oracle检查完系统要求不动,w10安装oracle, 正在检查操作系统要求... 实际结果: 6.2...
  10. 牛客网-内心里的一把火
  11. java 异步处理数据格式_spring mvc对异步请求的处理
  12. AcWing285. 没有上司的舞会(树形DP)题解
  13. 惠普p1106打印机安装步骤_惠普p1106打印机驱动程序下载
  14. spring三大核心
  15. 6目摄像头照片球面投影变换拼接全景图片
  16. Flutter时间轴
  17. python凯撒密码流程图_凯撒移位密码加密算法的Python3.0实现方法
  18. 项目经理成功的五个关键因素
  19. IOS逆向之汇编基础
  20. 嵌入式实操----基于RT1170 首板硬件之EEPROM AT24C16调试(十五)

热门文章

  1. Agile——Scrum
  2. 使用GROOVY脚本语言发送get和post请求
  3. 人人网官方Android客户端源码分析(1)
  4. 团贷网面试php,团贷网的钱还能要回来吗?
  5. Scratch2.0《飞镖对战游戏》.sb文件
  6. python做图像识别该学什么专业,郑大自动化学生来达内培训学Python技术,获1.2万月薪担任AI图像识别...
  7. 解决UNITY3D导入模型贴图材质丢失
  8. 为什么你使用程序化自动交易接口没有赚到钱?
  9. 快递柜也能攻击?——论API的安全性
  10. 字符串算术表达式求值-简单计算器实现(栈)-数据结构和算法(Java)