在2002年的电影《少数派报告》中,汤姆·克鲁斯扮演的是一位预防犯罪的警察,他借助科数据分析的技术,能够在坏人作案之前就预测出他们的犯罪行为。

2002年,这部电影还只是一部科幻片,但到了2011年,这就成了现实。《纽约时报》在2011年刊登了一篇报道,标题为“在犯罪发生前派遣警力”。

讲的是美国加州圣克鲁兹市 警察局的电脑程序预测出闹市区的一个停车场将有可能发生汽车盗窃案件,于是自动派遣警察前往现场。

到场的警察随后逮捕了两个形迹可疑的女人,其中一个人是警局的常客,另外一个人身上携带着毒品。

这里的“预测执法”属于预测分析学的一部分。犯罪总是带有不确定的成分,这就好比没有谁能够确切地说谁会撞车、买房贷款银行也不知道谁会还不起钱。

那么,警察是如何做到预测犯罪的,以及买房贷款时银行是如何预测你是否能还的起贷款?

他们用的预测工具正是概率。那么,什么是概率呢?

1

什么是概率?

我们经常会在生活中听到这句话:选择比努力更重要

相信你也无数次听过这句话,但是有没有想过:这句话背后的真实含义是什么呢?

我们每天拥有固定的时间和精力,注意这里“固定”是指你的资源和时间都是有限的。在这个前提下,把它们投入到哪些方向上能够取得最佳的效果,这是我们每天都要思考的问题。

举个具体的例子,假如你刚毕业,已经拿到3家公司的offer,一家传统企业的职位,一家创业公司的职位,一家上市互联网公司的职位,你选哪个?

因为你的时间和精力是有限的,所以你不能同时到这3个公司去上班赚钱,不然你就是孙悟空72变了。

你只能在有限的资源和时间下,做一个最佳选择,这个选择代表你去哪家公司工作,未来3年内能让你赚钱能力提升的可能性最大。

这里我们提到可能性,但是只知道可能性是无法做出判断的。

例如我告诉你腾讯股票明天上涨的可能性很大,同时我也告诉你阿里巴巴股票明天上涨的可能性很大。

但是你的钱是有限的,只能选择其中1个来购买。然而不幸的是,我只告诉你两个股票都可能上涨,但是你却没办法判断出买哪支股票是最好的选择。

所以只知道可能性是不行的,这时候数学家就出来吼了一嗓子:如果用某种办法计算出可能性,并用数值来表示这种可能性,不就解决了。

还是刚才的例子,我告诉你腾讯股票上涨的可能性是70%,阿里巴巴上涨的肯能新是90%,两个可能性的数值一比较,你立马知道该怎么选择了。

这里用数值来衡量可能性就是下面图片里描述的概率。

概率就是用数值来表示某件事发生的可能性。

当你知道了概率这个数值,就代表你可以预测未来,因为你能通过概率来判断出哪种情况发生的可能性最大。

例如你在玩抛硬币游戏,正面朝上的可能性是多少呢?

由于硬币只有两面,也就是落地后有两种结果,要不正面朝上,要不就是反面朝上,所以抛硬币正面朝上的可能性用数值来表示,概率就是50%,

你看,概率就在我们的日常生活中。只要你面临选择的问题,概率就会用数值表达哪种可能性最大,然后帮助你做出最好的选择。

2

生活中的经典概率案例

通过下面图片的“概率线”里几个生活中常见的概率数值,让你对概率有个整体上的理解。

概率的值永远在0-1范围之间。

如果某件事不可能发生,则其概率为0,对应的就是这条直线上最左端的位置。

如果某件事肯定会发生,则其概率为1,,对应的就是这条直线上最右端的位置,也就是那个点赞的大拇指。

大多数时候,你所面临的都是介于0和1之间的概率事件。

比如这条直线上更靠近左端的抛筛子,某一面数值朝上的概率是1/6。

处于中间位置的是抛硬币,正面或者反面朝上的概率都是50%

靠近右端的从4个蓝色球,1个红色球里面选出4个蓝色球,正好都是蓝色球的概率是4/5。

这句话很简单,但是非常重要,在之后的投资,和数据分析中我会反复提到,跟我一起默念三遍:

如果你做的事情概率低于50%,那就别去做了,因为成功的概率还不如抛硬币可能性高呢。

你看,概率其实就是这条直线上的某个数值点,有时候它更靠左边一些,表示不太可能发生。有时候它更靠近右边一些,表示概率超过50%,更可能发生。

简单吧,很多老师上课都是把概率讲的复杂了。其实概率就来源于我们的生活,用于解决我们生活中的问题。

3

如何计算概率

在理解了概率的本质含义后,我们一起聊下如何计算概率。

例如你在玩抛筛子游戏,想知道筛子落下来后正面朝上数字为1的概率是多大?

我们来想想这个过程,一个筛子有6个面,6个面的数字分别是1到6这6个数值,所以筛子落下来总共有6种可能的结果。

筛子正面朝上数字为1的情况只有1种,那么筛子正面朝上为1的概率=正面朝上数字为1的可能数目/所有可能结果的数目=1/6。

这里分母是6表示跑筛子这个事情总共有6种结果,分子是1表示正面朝上数字为1的可能结果只有1中,所以是1/6。

我们可以用一种更通用的方法表示以上情况,对于事件A的概率=发生事件A的可能个数/所有可能的结果总数。

在统计概率中用“事件”表示某件事情。例如刚才抛筛子上面朝上数值为1就是一个事件。

在一定条件下,可能发生,可能不发生的事件叫做随机事件。例如我们抛骰子就是一个随机事件。

当然这是最简单的概率计算,有时候概率计算很复杂。假如你不知道某件事情发生的可能结果,就没办法计算概率了。这时候该怎么办呢?

我这里给出两个经常用的求概率的办法。

第1个计算概率的办法是寻找这个行业里的权威机构或者网上查资料去了解,一般会有前人计算出的概率给你参考。

例如我们已经知道飞机是所有交通工具里最安全的,但是因为我们是懂概率的人,就想进一步知道飞机上哪些位置存活率最高。

这个概率你在网上就可以找到飞机存活率分布图。最后发现,飞机尾部的乘客座位,发生事故生还可能性最高,高达69%,

但是如果网上查不到前人计算的概率值,该怎么办呢?

可以用第2中计算概率的办法:数据分析。

这里我们举一个例子,你就明白啦。

保险公司在提出一个保险项目之前,都会有一名保险商计算出该项目的发送概率,一旦确定了确定了发生概率,保险商就能决定该项保险的投保费用是多少。

投保费用的计算我之后的文章会详细讲,这里我们重点来看下保险商是如何计算概率的。

例如林志玲小姐经常在高尔夫球场附近跑步,为了防止被突然飞过来的高尔夫球打破自己漂亮的脸蛋,她就去买保险。这时候保险商就要计算出一个高尔夫球场打伤1个人的概率是多少。

如何计算概率呢?

保险商要做的第一件事,就是去咨询一下职业高尔夫协会,了解一下一年里面有多少人被飞来的高尔夫球打的受伤。咨询后得知一年有35人被打伤。

第2步,保险商获取到全国高尔夫球的数据,然后统计出全国有20万的高尔夫球场。

第3步,该保险商用我们前面介绍的计算概率的公式,发生该事件的个数35,除以高尔夫球场的总数20万,就得到一个高尔夫球场打伤1个人的概率了。

同样的道理,在复杂的数据分析中,计算概率也是想办法从数据中找到发生某件事情的数目,然后除以总数目。

4

概率对我有什么用?

现在,你已经知道了什么是概率,如何计算概率。

那么接下来我们一起思考一个问题:

概率对于提升我们的生活质量到底有什么帮助?

作为成年人,我们知道这个世界是不确定的,所以不会要求自己每件事都必须成功,但是我们要努力让每件事成功的可能性变得更大,也就是让每件事成功的概率变的更大。

概率就是这样一门研究不确定事件和结果的学问。

投资股市存在着不确定性,抛硬币同样也存在着不确定性,因为有的时候你得到的是硬币的正面,有的时候是硬币的反面。

连续4次抛一枚硬币更是增加了这种不确定性,因为每一次都有可能是正面或反面,如果你手里有一枚硬币并且连续抛了4次,我事先无从得知4次的准确结果(你也不能),但根据前面概率的计算公式,我们可以计算出:出现两个正面的概率要大于出现4个正面。

在获得并信任此类信息的前提下,决策者常常能够看清风险、作出决定。

举个例子,澳大利亚运输安全局曾经发布了一份有关乘坐不同交通工具导致死亡的风险报告。大家都觉得飞行非常可怕,但实际上商业航空旅行的风险是微乎其微的。

澳大利亚自20世纪60年代起就再没有发生过一起商业航空致死事故,因此航空旅行每一亿公里的死亡率基本为0。汽车每一亿公里旅行的死亡率为0.5,真正吓人的是摩托车的死亡率,因为摩托车的死亡率比汽车整整高出35倍。

那么,为什么在大多数人的直觉中飞机却是最不安全的呢?

那是因为如果飞机失事,必然会引起极大的关注,这时,你多半会觉得飞机很危险。但事实上。论每公里死亡率,坐飞机比坐汽车安全22倍。

但是很可悲的是,大多数人是缺乏概率常识的,下面图片里的例子是最好的证明。

这里的第1张图片是外卖小哥因交通事故死亡,据统计,2017年上半年,涉及到上海市送餐外卖行业的伤亡道路交通事故共76起,“饿了么”和“美团外卖”各占26%。

要知道,在统计概率里,骑摩托车死亡率是最高的,如果懂点统计常识,是如何都不能选择这个行业的。这无非等于拿命赚钱,根本不划算。

第2张图片是美国的911事件。

康奈尔大学的3位研究人员在一篇引人入胜的论文中这样说道,可能有数以千计的美国人在“9·11”恐怖袭击事件发生之后由于害怕坐飞机而死于非命。我们永远都不知道遭受恐怖袭击的真正风险到底有多大,但我们知道开车确实是一件危险的事。

在“9·11”恐怖袭击事件发生之后,越来越多的美国人选择自驾出行,而不选择乘坐飞机。

据统计,在考虑平均死亡率和天气等导致路面交通事故因素的前提下,2001年10~12月,平均每个月因交通事故致死的人数比以往多了344人。该效应随着时间的推移逐渐减弱,这是因为大家对恐怖主义的恐惧在慢慢消退。

但这项研究的作者认为,“9·11”恐怖袭击事件导致的驾车死亡人数或已超过2000人。

你看,在不懂概率的情况下,选择交通方式都会导致死亡率的提升。

现在我们回过头来看下学习概率到底对我们有什么用。

虽然概率并不会确凿地告诉我们将会发生什么,但我们通过计算概率能够知道很有可能发生什么、不太可能发生什么。

聪明的人会使用这类数据为自己的事业和生活指明方向。牛人就是持续对大概率事件下注,并同时有意识预防那些足以毁掉你生活的风险。

我认为每个人都应该学一些概率知识,它现在是公民必备基础知识。当不懂概率的人大惊小怪的时候,懂概率的你可以可以淡定自若。

其实,大多数人在中学的数学课中就学习过概率,但掌握概率的计算方法不等于真正理解概率。

实际上,概率中的几个关键思维,是多数数学老师没有讲明白,甚至这些老师自己就没有弄明白。理解这些思维不需要你会做任何计算,但是它们能让我们看世界的眼光发生根本的改变。

这些思维的逻辑很简单,我们可以从最简单的概率中得到4个生活中的智慧。

这4个生活中的智慧就是:赌徒谬论,大数定律,如何投资赚钱最多,如何预防风险。我后在后面的文章中详细展开聊。

1.什么是概率?

概率是用数值表示某件事情发生的可能性,我给出了概率线,让你对各类事件发生的概率有了大致的认识。

2.如何计算概率?

第1种方法是在网上查找前人计算的经验值。

第2种方法是用数据分析来计算出事件发生的数目,然后除以总数目。

3.概率对我有什么用?

虽然概率并不会确凿地告诉我们将会发生什么,但我们通过计算概率能够知道很有可能发生什么、不太可能发生什么。

聪明的人会使用这类数据为自己的事业,生活,和投资指明方向。牛人就是持续对大概率事件下注,并同时有意识预防那些足以毁掉你生活的风险。

什么是概率?对我有什么用?相关推荐

  1. 可视化反投射:坍塌尺寸的概率恢复:ICCV9论文解读

    可视化反投射:坍塌尺寸的概率恢复:ICCV9论文解读 Visual Deprojection: Probabilistic Recovery of Collapsed Dimensions 论文链接: ...

  2. c语言产生一m序列,其特征多相式:1+x^3+x^5,M序列伪随机码在测距回答概率控制中的 - FPGA/ASIC技术 - 电子发烧友网...

    M序列伪随机码在测距回答概率控制中的应用 测距器(Distance Measuring Equipment)系统分为机载询问器和地面应答器两部分.其测距原理为二次雷达测距原理.系统工作时,由机载询问器 ...

  3. php ajax 概率 转盘,php+jquery实现转盘抽奖 概率可任意调

    转盘抽奖,炫丽的一般是flash做的.不懂flash而又不需要那么炫丽,可以简单的通过jquery来实现.网上教程有很多,跟着做了一下,也贴出来吧.要实现转盘抽奖,有两个关键点,一是让转盘或指针转起来 ...

  4. python朴素贝叶斯回归预测的结果全是1_python – 朴素贝叶斯概率总是1

    我开始使用sklearn.naive_bayes.GaussianNB进行文本分类,并且获得了很好的初始结果.我想使用分类器返回的概率作为置信度的度量,但predict_proba()方法总是为所选类 ...

  5. OpenCV中的霍夫线变换、概率霍夫线变换

    OpenCV中的霍夫线变换.概率霍夫线变换 1. 效果图 2. 原理 2.1 什么是霍夫变换? 2.2 什么是概率霍夫变换? 3. 源码 3.1 霍夫变换 3.2 概率霍夫变换 参考 这篇博客将介绍P ...

  6. LightOJ - 1038 Race to 1 Again 基础期望概率 dp

    传送门 刚刚学习期望&概率 我们设数X的期望改变次数为P[X] 如果要求X的期望,很容易想到找x的因子; 可以得到下式  ,cnt为X因子个数,ai为X的因子 可以这么理解,当因子ai为1时, ...

  7. 深度学习(2)基础2 -- 分类:得分函数损失函数(损失、正则化惩罚项、梯度下降、学习率)概率

    目录 一.得分函数 1.10分类 2.5分类 二.损失函数 0.引言 1.损失函数(数据损失) 2.损失函数应用 3.损失函数(数据损失与正则化惩罚项) 1.数据损失 2.正则化惩罚项 三.概率 1. ...

  8. 【论文速读】城市自动驾驶应用的概率语义地图

    点云PCL免费知识星球,点云论文速读. 标题:Probabilistic Semantic Mapping for Urban Autonomous Driving Applications 作者:D ...

  9. 《概率机器人》里程计运动模型gmapping中代码解析

    里程计运动模型(odometery motion model)用距离测量代替控制.实际经验表明虽然里程计虽然仍存在误差,但通常比速度运动模型更加的精确.相比于速度运动模型运动信息utu_t由 (x¯t ...

  10. 《概率机器人》速度运动模型gmapping中代码解析

    一个刚性移动机器人的构型通常用6个变量来描述:他的三维直角坐标系,以及相对外部坐标系的三个欧拉角(RPY 横滚 ,俯仰,偏航),所以那么在平面环境中一般用三个变量既可以描述,称之为位姿. 所以一般而平 ...

最新文章

  1. linux系统中如何查看日志 (常用命令)
  2. 线索二叉树(基于链表存储树结点)
  3. 京东:Flink SQL 优化实战
  4. python简单代码-python实现顺序表的简单代码
  5. 【Codeforces Round #533(Div. 2)】D.Kilani and the Game【多源bfs】
  6. 机器学习、深度学习常见面试题300道
  7. QTreeView 详解 并设置样式表
  8. 24个基本指标精粹讲解(16)--DMA
  9. 初学者:html中的表单详解(下面附有代码)
  10. js设计模式--代理模式
  11. 【bzoj3687】简单题
  12. 鲲鹏devkit开发套件——编译调试工具介绍
  13. 大数据与人工智能实验室【2022-05-08】
  14. 生日悖论的Python实现
  15. (转)Linux 一句话精彩问答
  16. iview table点击单元格事件
  17. java面试——集合(ArrayList、lterator、LinkedList)源码理解
  18. 【Java Web】jsp与jspf文件的区别
  19. Tomcat8安装及配置教程
  20. 人脸识别html5效果,HTML5网页端摄像头人脸识别

热门文章

  1. 长得像就是双胞胎?图样图森破
  2. Office 2010安装过程中修复“错误2203。发生内部错误”
  3. Mysql获取当天用户生日
  4. 利用微信官方文档下载微信对账单、资金账单
  5. Premiere Pro 中的键盘快捷键
  6. 微信抢票应用-个人总结
  7. 机械革命bios升级_¥1500买6年前神舟老战神,3内存+4硬盘升级潜力强,鲁大师15万!...
  8. linux命令配置永久ip地址,Linux命令行永久修改IP地址、网关和DNS。
  9. Java 音频处理技术
  10. IPA安装的几种方法