多数人第一次听说贝叶斯定理应该是在中学课堂上。那个公式看起来并不复杂,在一众花里胡哨的考点中显得平平无奇。

但是很快,我们就知道了什么叫深藏不露。从高校教材到研究实战,贝叶斯这三个字频繁地出现在信息科学的重要议题中,它甚至从一个定理变成了一种思想。

这样的转变当然不是一朝一夕完成的。在历史上,贝叶斯主义者花了大约两百多年的时间,冲破重重阻力,才让人们看到贝叶斯定理所蕴含的丰富宝藏。

01

不被认可的新思路

贝叶斯定理

贝叶斯定理看起来确实不怎么惊艳,就连提出者贝叶斯本人也不太重视这个成果,甚至没有在有生之年发表它。在他去世两年后,贝叶斯定理才正式进入人们的视线。

事实上,第一位真正的贝叶斯主义者是拉普拉斯。1774年,这位数学家兼天文学家提出了能够从贝叶斯公式推出的拉普拉斯接续法则

简单来讲,这个法则说的就是,在一件不断重复发生的事件中,人们可以根据以往出现的结果来预判未来的结果。比如,以往太阳天天升起,那么它明天十有八九还是会升起。

但这个体现了贝叶斯式智慧的法则却引来了一大波群嘲。直到19世纪,学界主流仍在批判它。

数学家乔治·克里斯特尔甚至断言,“(这些概率)已经死了,我们应该将它们体面地埋葬在看不到的地方,而不是在课本和试题中介绍它们……我们应该允许自己悄悄忘却伟人的鲁莽之处。”

为什么会这样?

因为在那时,多数人把客观性当作不能碰触的原则。人们认为,你统计到位,计算正确,就可以找到答案,否则就是错了。拉普拉斯接续法则却给概率引入了一定的主观性。

假设我们是远古时代的巨灵,只见过太阳升起五次,如果在这个时候应用拉普拉斯接续法则,那么关于太阳是否会再次升起,我们就会算出一个比较小的概率。随着时间的推移,我们的得数还会变化。在很多人看来,这着实奇葩。

强调客观性的主流学者形成了频率派。依然相信主观性在概率中蕴藏着巨大价值的学者形成了贝叶斯派。

进入20世纪,频率派对贝叶斯派的排挤和打压如此猛烈,频率派的代表人物罗纳德·费希尔甚至用上了“谬误的垃圾”这种极具侮辱性的字眼。

贝叶斯派不得不在夹缝中求生。甚至有时,贝叶斯主义的智慧已经得到证实,贝叶斯派仍然没有机会走到台前。

第二次世界大战

在第二次世界大战期间,艾伦•图灵带领团队破译了德军的恩尼格密码,立下大功。贝叶斯定理在其中发挥了重要作用。可惜这件事涉及太多政治因素,在战争结束后,英国政府选择继续保密。贝叶斯主义失去了一个正名的机会。

在20世纪50年代,英国精算师亚瑟•贝利发现有些同事在使用一些“来历不明”却格外实用的公式。那时的贝利还不知道,这些公式都和贝叶斯定理有着千丝万缕的联系,只是频率派占据着主导地位,把它们全都关在了正统教育的门外。

考虑到贝叶斯主义被排斥了两百多年,很难估计这一类的事件还有多少。但可以肯定的是,再怎么气势汹汹,频率派也无法改变事实。

02

时代给出了答案

事实就是,在频率派无能为力的问题上,贝叶斯派自有妙招。虽然被统计学的小圈子排挤,但在更加注重实干的领域,情况在悄悄改变。

比如,罗伯特•施莱弗和霍华德•赖法借助贝叶斯主义视角提出了包含不确定性的决策论。杰尔姆•科恩菲尔德在研究烟草的致癌问题时实践了贝叶斯统计,得出了重要结论。

美国国家航空航天局也曾聘请掌握了贝叶斯主义工具的机构,预测火箭发射出现重大事故的概率。在所有这些例子中,贝叶斯派理论都比频率派理论更有活力。

终于,贝叶斯派等到了逆袭的最佳的时机,那就是计算机科学的诞生和兴起。20世纪60年代,雷·所罗门诺夫将图灵的可计算性理论和贝叶斯公式结合起来,搭建了人工智能一般性框架的前身。

20世纪80年代,蒙特卡罗方法给贝叶斯公式的实际应用带来了革命。一个名为吉布斯抽样贝叶斯推断的程序更是宣布了贝叶斯主义的胜利。

贝叶斯派迎来新的发展。贝叶斯早已不再等同于一个公式或是一种主张,它的方法越来越先进,理论根系越来越发达。

统计学领域有一句名言:“所有模型都是错的,但有些是有用的。”出自在贝叶斯推断等方面做出重要贡献的统计学大师乔治·博克斯。这句话在某种意义上也成为了贝叶斯主义方法论的体现。

频率派很像老派的经典科学,喜欢强调确定性,而贝叶斯派则更像同样在20世纪掀起争议的量子力学。在频率派看来,参数就算未知也是客观的,而贝叶斯派则会说,参数也是千变万化的。他们深知任何一件事都有数不清的前因后果,寻找绝对客观几乎是不可能的。

既然如此,那就应该以动态的眼光看待模型,甚至想办法尽量多融入一些信息,再针对更为具体的目的产出结果。对于纯粹贝叶斯主义者来说,互不相容的模型不仅可以同时存在,还是件好事。

这种听起来有些不可思议的行事方法却在计算机的帮助下大放异彩。现在,贝叶斯式的智慧已经渗透到了人类社会的方方面面,涉及的领域包括但不限于:医学诊断、保险、金融、人工智能、神经科学、广告、物流、信号处理、航空航天工程……

可以说,没有一个现代人的生活与贝叶斯派毫无关系。

03

用贝叶斯主义者的眼睛看世界

更加令人惊奇的是贝叶斯主义和一些终极问题之间的关联。

图灵-丘奇论题告诉我们,宇宙中的任何东西都不能完成图灵机无法完成的计算。这意味着拥有足够的数据时,通用图灵机可以模拟整个宇宙。

既然如此,未来人们有没有可能拥有科幻小说中那种计算一切的机器呢?能不能用它来破解宇宙中的一切秘密呢?

雷·所罗门诺夫以贝叶斯主义者的方式回答了这个问题。他提出一个有趣的公式,叫“所罗门诺夫归纳法”。这个公式也被一些年轻的贝叶斯主义者称为贝叶斯定理的终极形态。

理论上讲,如果输入的数据中含有某种模式,这个公式最终会找到它,所需时间和所罗门诺夫复杂度成正比。这似乎是一个乐观的结论,然而所罗门诺夫归纳法是不可计算的。计算一切的机器依然要留在人们的幻想里。

那么这个理论还有什么用处呢?

有的,它说明了完备性和可计算性之间的矛盾。所罗门诺夫指出,所有可计算的知识哲学都不可能检测出数据中的所有规律。换个说法,任何可计算的知识哲学都有可能在某种条件下持续给出错误的预测,这和哥德尔的不完备性定理形成了微妙的映照。

即便突破了种种不可能,拥有了满足条件的图灵机,可以运行所罗门诺夫归纳法,宇宙也有办法欺骗我们,只要有一段代码的所罗门诺夫复杂度大于提供的信息量即可。如此一来,即便拥有无穷无尽的计算能力,你也无法确认任何真理。

从另一个角度看,支配自然界甚至人类社会的规律也隐藏着贝叶斯式的逻辑。如果我们对生物学中的洛特卡-沃尔泰拉方程进行一些代数运算,推出支配种群中不同变种所占比例变化的方程,就会发现它和贝叶斯公式有着惊人的相似之处。

自然界的演化智慧创造了人脑,我们现在才开始尝试用人工智能来模仿它。而在人类文明演进的历史中,不同民族、不同背景的人观念和习俗的形成背后,也藏着先验概率和后验概率的强大引导。

既然如此,我们究竟生活在一个什么样的世界里呢?

从贝叶斯派的视角来讲,即便你说“我们的世界是假的,是神的虚拟程序”,这个回答也不必马上被打上“荒谬”的标签。这样宏伟的问题也许永远不会有定论,但假设真的存在所谓的神,那祂一定是个淘气又充满活力的贝叶斯主义者。

写在最后

频率派喜欢说贝叶斯派不客观,或者说持有偏见,但贝叶斯派的智慧恰恰是一种关于偏见的智慧

在现实中,没有谁是全知全能的。有的人因为害怕犯错而不再前进,有的人干脆否认偏见的普遍存在,把经过有限验证的道理当成普适真理。

而贝叶斯派则接受偏见的存在,他们相信,所谓追求真理,就是人们从偏见出发,一步步走向客观的过程。

他们愿意以动态的视角看待真理,也愿意不断学习,不断走出偏见——贝叶斯派的精神就在于此。

关于贝叶斯主义,值得详细了解的内容还有很多。比如贝叶斯主义造就的所罗门诺夫妖,比如贝叶斯方法和过度拟合,再比如贝叶斯大脑。

所有这些内容,你都可以在这本书里找到——《贝叶斯的博弈》

# 今日荐书 · 互动# 

  • 说说你觉得最了不起的贝叶斯应用是什么?

  • 挑选1位幸运同学,送出你想要的一本书,5月8日开奖!

点击图片购买

题图:freepik.com

喜欢这篇文章?点个“在看”吧~▼

被嫌弃的贝叶斯派的逆袭相关推荐

  1. 贝叶斯集锦:贝叶斯派和频率派的一个例子

    转载自:http://site.douban.com/182577/widget/notes/10567181/note/278503359/ 这个例子的主要目的在于探讨贝叶斯派和频率派适用的具体情境 ...

  2. 机器学习基础——先验概率、后验概率和似然估计的讲解;频率派和贝叶斯派之分;以及MLE和MAP方法的解析

    1.先验概率 假定 B 1 , B 2 , - , B n B_1,B_2,\ldots ,B_n B1​,B2​,-,Bn​是某个过程所有可能的前提条件,也就是 B 1 , B 2 , - , B ...

  3. 『机器学习白板』频率派vs贝叶斯派

    频率派vs贝叶斯派! 文章目录 一. 数据描述 二. 频率派观点 三. 贝叶斯派观点 四. 总结 五. 参考文章 一. 数据描述 对概率的诠释有两大学派,一种是频率派另一种是贝叶斯派.后面我们对观测集 ...

  4. [zt]数学之美番外篇:平凡而又神奇的贝叶斯方法

    数学之美番外篇:平凡而又神奇的贝叶斯方法 Tags: 数学, 机器学习与人工智能, 计算机科学 save it69 saved tags: 贝叶斯 math bayesian algorithm 数学 ...

  5. 什么是贝叶斯定理?朴素贝叶斯有多“朴素”?终于有人讲明白了

    导读:如果有一天,我们知道的统计规律和现实生活发生了冲突,又或者前人的经验不符合亲身经历,那么该怎么办?面对经验与现实的矛盾,我们需要一种应对方案. 作者:徐晟 来源:大数据DT(ID:hzdashu ...

  6. NB贝叶斯平凡而又神奇的贝叶斯方法

    转自:http://mindhacks.cn/2008/09/21/the-magical-bayesian-method/ 概率论只不过是把常识用数学公式表达了出来. --拉普拉斯 目录 0. 前言 ...

  7. 非常全面的贝叶斯网络介绍 非常多的例子说明

    0. 前言 这是一篇关于贝叶斯方法的科普文,我会尽量少用公式,多用平白的语言叙述,多举实际例子.更严格的公式和计算我会在相应的地方注明参考资料.贝叶斯方法被证明是非常 general 且强大的推理框架 ...

  8. 贝叶斯推断 概率编程初探

    1. 写在之前的话 0x1:贝叶斯推断的思想 我们从一个例子开始我们本文的讨论.小明是一个编程老手,但是依然坚信bug仍有可能在代码中存在.于是,在实现了一段特别难的算法之后,他开始决定先来一个简单的 ...

  9. 机器学习读书笔记之6 - 贝叶斯系列

    概率论只不过是把常识用数学公式表达了出来. --拉普拉斯 目录 0. 前言  1. 历史      1.1 一个例子:自然语言的二义性      1.2 贝叶斯公式  2. 拼写纠正  3. 模型比较 ...

最新文章

  1. R语言If、Else条件语句实战
  2. 递归调用(Java)
  3. 移除VS解决方案和TFS服务器的关系
  4. python 鸭子类型及三大特性
  5. linux nginx安启动_linux下nginx编译安装启动
  6. JeeWx 微信开发公开课(Jeewx-API 专题),今晚8点不见不散
  7. Centos Docker 安装 Redis 并测试使用记录
  8. ansible的命令操作模块6
  9. 一篇文章讲清楚人工智能、机器学习和深度学习的区别与联系
  10. iOS UISearchBar 在界面跳转时出现灰色背景问题
  11. Web SQL本地数据库(SQLLite)
  12. Makefile教程
  13. 五个维度打造研发管理体系
  14. 24点之5 7 7 11
  15. 资源管理器 右键 反应慢 现象解决方案
  16. nginx + ftp搭建文件服务器
  17. 伊斯坦布尔之旅返程:夜景和免税店
  18. 计算方法 7.数值积分计算方法
  19. 10个程序员可以接私活的平台和一些建议!
  20. 【Python百日进阶-数据分析】Day325 - plotly.express.scatter_3d():3D散点图

热门文章

  1. java塞班手机最大闪存rom_揭秘:为什么手机ROM最大只有256GB?
  2. python+unittest+excel接口自动化_Python+requests+unittest+excel实现接口自动化测试框架
  3. fp格式图片_2020Pamp;I | 适马无反版100-400镜头亮相,fp全幅微单满足不同需求
  4. 【c语言】蓝桥杯基础练习 回文数
  5. qt ui界面无法移动控件_使用qt 键盘上的方向键只能控制ui界面上的按钮选择,不能实现我设定的功能...
  6. 什么是微服务架构,该从哪些方面深入理解?
  7. 如何用java使用POI读取excel文件,创建excel文件,实现批量导出和导入
  8. RedHat 7.0 Chrome浏览器 安装
  9. 使用runtime让button传递多个参数
  10. 微软 Windows 10 物联网版系统 IoT 介绍 树莓派2 可以装一下