【个人学习笔记】概率论与数理统计知识梳理【一】
作为一门基础学科,概率论应用太广泛了,由于总有遗忘,翻看教材又太麻烦,于是打算记下笔记与自己的一些思考,参考用书是浙江大学盛骤编写的《概率论与数理统计》。
第一章 概率论的基本概念
- 一、随机试验
- 二、样本空间与随机事件
- 1.样本空间
- 2.随机事件
- 3.事件间的关系与运算
- 三、频率与概率
- 四、古典概型
- 五、条件概率
- 六、独立性
- 总结
一、随机试验
参考用书中给出的关于随机试验的定义如下:
(个人比较喜欢各种数学定义,因为数学定义是对事物的高度抽象概括,可以很全面地总结一个东西。)
1.可以在相同条件下重复地进行;
2.每次试验的可能结果不止一个,并且能事先明确试验的所有可能结果;
3.进行一次试验结果前不确定哪一个结果会出现。
概括总结一下就是三点特性:试验的可重复性,结果的多样性、可明确性与不确定性。其实是个很简单的概念。
二、样本空间与随机事件
1.样本空间
定义:
我们将随机试验E的所有可能结果组成的集合称为E的样本空间,记为S。样本空间的元素,即E的每个结果,称为样本点。
同样是简单明了的定义。
2.随机事件
定义:
一般,我们称试验E的样本空间S的子集为E的随机事件,简称事件,在一次试验中,当且仅当这一子集中的一个样本点出现时,称这一事件发生。
相关的就会有一堆我们常见的事件的定义了,比如S全集就是必然事件,空集就是不可能事件,另外每个元素都可以看作S的子集,所以它们也是事件,并被称为基本事件,因为它们是有可能发生的最小的事件集合。
可以从定义上看到,事件就是集合,他与试验是否发生并没有关系。
3.事件间的关系与运算
因为事件本质上就是集合,所以事件间的关系与运算其实就是集合的关系与运算,通过事件A、B给出下面一些关系:
相等: A⊂BandB⊂A⇒A=BA\subset B\, and\: B\subset A\Rightarrow A= BA⊂BandB⊂A⇒A=B
和事件:A∪BA\cup BA∪B
积事件:A∩BA\cap BA∩B
差事件:A−BA - BA−B
分别对应集合的并集、交集,差。此外当积事件为空集,称这两个事件互斥;特别的,如果他们的和事件还是S时,称他们互为对立事件。
事件的运算也就对应了集合的运算,相关的交换律结合律都满足,以及德摩根律。
A∪B‾=A‾∩B‾,A∩B‾=A‾∪B‾\overline{A\cup B}=\overline{A}\cap \overline{B},\overline{A\cap B}=\overline{A}\cup \overline{B}A∪B=A∩B,A∩B=A∪B
其意义也很直白,A与B其中一个发生的对立事件就是A与B均不发生,以上的所有关系都和集合一样可以推广到n个事件的关系,不再赘述。
提到集合的交并补就容易想到容斥原理:
容斥原理描述集合并集的元素个数与各个集合元素个数的关系,从公式上直观的理解其实是很形象的,先直接把各个集合的元素相加,然后把两两的交集减去,因为交集中的元素重复计算了一次,再把三个集合的元素加回来,因为这些交集中的元素在前一个减式中被重复减去了一次…
容斥原理在组合中有很多应用,一种最常见的思路就是将组合问题分解为求子问题并集的方式(交集问题可以取反)分别求解,然后通过容斥原理进行合并。
三、频率与概率
频率定义:
在相同条件下,进行了n次试验,在这n次试验中,事件A发生的次数nAn_{A}nA为事件A发生的频数,比值nAn_{A}nA/ n称为事件A发生的频率,并记成fn(A)f_{n}(A)fn(A).
概率定义:
设E是随机试验,S是它的样本空间,对于E的每一事件A赋予一个实数,记为P(A),称为事件A的概率,如果集合函数P()满足下列三条:
非负性:函数值恒大于等于0
规范性:P(S)=1
可列可加性:互斥事件的概率之和等于其和事件的概率。
比较可以发现,频率是满足概率的三条性质的,所有频率其实就是概率的一种特例,其实就是一种古典概型。
通过概率的三条性质有一些简单的推论,如概率恒小于等于1,空集概率为0,对立事件的概率等。值得一提的是加法公式:
P(A∪B)=P(A)+P(B)−P(AB)P(A\cup B) = P(A) +P(B)-P(AB)P(A∪B)=P(A)+P(B)−P(AB)
原理与容斥原理一样,A、B和事件发生的概率等于其各自发生的概率之和减去重复计算了一次的AB积事件。
四、古典概型
满足以下两点性质的随机试验E称为古典概型:
试验的样本空间只包含有限的元素;
试验中每个基本事件发生的可能性相同。
总结起来就是有限性与等可能性。古典概型在生活中的例子比比皆是,抛硬币、掷色子等等,所以它也是概率论早期的主要研究对象。
古典概型的概率计算公式其实就前面所说的频率了,它的计算公式十分简单直观:
P(A)=∣A∣∣S∣P(A) = \tfrac{\left | A \right |}{\left | S \right |}P(A)=∣S∣∣A∣
实际推断原理:
小概率事件实际上在试验中几乎是不发生的。
这个原理看起来很朴素,其实有时候在学习的过程中是有用处,比如你的实验如果发生了小概率事件,那很有可能就是你的实验存在系统上的问题了hhh
还有一些看名字就能明白的概念,放回抽样不放回抽样不再介绍。
五、条件概率
条件概率是很重要的一个概念,它表述的是在某种条件下事件发生的概率,它的定义如下:
事件A在B发生的条件下,发生的概率记为P(A∣B)P(A\mid B)P(A∣B)
P(A∣B)=P(AB)/P(A)P(A\mid B) = P(AB)/P(A)P(A∣B)=P(AB)/P(A)
很容易可以验证,条件概率满足概率的三条性质,所以条件概率也是概率。将公式变换一下就可以得到所谓的乘法公式:
P(AB)=P(A∣B)⋅P(B)P(AB) = P(A\mid B)\cdot P(B)P(AB)=P(A∣B)⋅P(B)
这个公式可以推广到n个事件的积事件的概率,这都是一样的。这个公式也很好理解,就是我要去考察事件A和B同时发生的概率,我只需要去考虑A先发生,然后B在A发生的条件下的概率,这两个条件同时满足就是公式右边。
顺着这个思路发展下去,一个事件A的发生可以整理出一系列原因BiB_{i}Bi,那么由某个原因导致该事件发生的概率其实就是乘法公式,将所有这些原因导致A发生的概率求和就是全概率公式:
P(A)=∑inP(A∣Bi)P(Bi)P(A)=\sum_{i}^{n}P(A\mid B_i )P(B_i)P(A)=∑inP(A∣Bi)P(Bi)
其中B1...BnB_1...B_nB1...Bn是样本空间S的一个划分,它需要满足两两之间互斥,并且所有BiB_iBi的和事件是S。可以简单地理解为把一个大饼切完以后的集合,所以划分这个名字还是十分贴切的。
有了这些基础,我们的贝叶斯公式也就呼之欲出了:
P(Bi∣A)=P(A∣Bi)P(Bi)/∑inP(A∣Bi)P(Bi)P(B_i\mid A)=P(A\mid B_i)P(B_i)/\sum_{i}^{n}P(A\mid B_i )P(B_i)P(Bi∣A)=P(A∣Bi)P(Bi)/∑inP(A∣Bi)P(Bi)
贝叶斯公式求出来的概率也就是我们常说的后验概率,如果说全概率公式是由因到果的话,贝叶斯公式就是由果索因,贝叶斯公式中的分母其实就是事件A发生的概率。它表述的是当事件A已经发生的条件下,BiB_iBi发生的一个条件概率,其实也就是这个结果(A发生)由BiB_iBi导致的概率。
六、独立性
独立性是概率论里时时刻刻都要讨论的一个问题,因为目前还只讲了随机事件,先介绍随机事件的独立性,其定义如下:
称满足以下等式的两个事件A、B互相独立
P(AB)=P(A)⋅P(B)P(AB) = P(A)\cdot P(B)P(AB)=P(A)⋅P(B)
将其推广到n个事件的话,要求任意k(<=n)个事件满足以上等式,可以看到独立性有着相当严格的定义。所以它也有着非常好的性质,一旦我发现两个事件是独立的,就可以完全分开去考虑了,这会大大简化问题。我们现实中遇到的问题往往是有着千丝万缕的关系,所以也常常不是独立的。
总结
第一次写博客,写了好久,虽然都是基础中的基础,但是也是一个不错的开始,希望自己可以坚持!2020.9.22
【个人学习笔记】概率论与数理统计知识梳理【一】相关推荐
- 概率论与数理统计知识
导言:本文从微积分相关概念,梳理到概率论与数理统计中的相关知识,但本文之压轴戏在本文第4节(彻底颠覆以前读书时大学课本灌输给你的观念,一探正态分布之神秘芳踪,知晓其前后发明历史由来),相信,每一个学过 ...
- 据挖掘中所需的概率论与数理统计知识
据挖掘中所需的概率论与数理统计知识 ( 关键词:微积分.概率分布.期望.方差.协方差.数理统计简史.大数定律.中心极限定理.正态分布) 导言:本文从微积分相关概念,梳理到概率论与数理统计中的相关知识, ...
- 数据挖掘中所需的概率论与数理统计知识,上
http://www.cnblogs.com/v-July-v/archive/2012/12/17/3125418.html 数据挖掘中所需的概率论与数理统计知识.上 ( 关键词:微积分.概率分布. ...
- 【转载】数据挖掘中所需的概率论与数理统计知识
[转载]数据挖掘中所需的概率论与数理统计知识 (关键词:微积分.概率分布.期望.方差.协方差.数理统计简史.大数定律.中心极限定理.正态分布) https://blog.csdn.net/zbj366 ...
- 概率论与数理统计知识总结——纵向分布式
文章目录 概率论与数理统计知识总结 概率论与数理统计知识总结 泊松分布及其性质 指数分布及其性质 正态分布及其性质 负指数分布及其性质 超几何分布及其性质
- 数学学习笔记--概率论
2. 概率论 2.1 概率分布与随机变量 2.1.1 机器学习为什么要使用概率 事件的概率是衡量该事件发生的可能性的量度.虽然在一次随机试验中某个事件的发生是带有偶然性的,但那些可在相同条件下大量重复 ...
- 自学考试之概率论与数理统计知识框架
看了下软考成绩,上午49,下午51,没有什么意外的话,通过了!其实完全可以考的更好,但当时太紧张了,也没有调整好心态,还是缺乏相应的锻炼!还有一点,基础的东西,还是要再强化一下. 学历的意义在于基础, ...
- 数理方程及MATLAB解算学习笔记
数理方程及MATLAB解算学习笔记 文章目录 数理方程及MATLAB解算学习笔记 第一章 MATLAB基础知识 1.class查询数值类型 2.永久性数值变量 3.创建特殊矩阵的专用指令 4.基本初等 ...
- 《数据挖掘导论》学习笔记(第1-2章)
本文主要是在学习<数据挖掘导论(完整版)>中的学习笔记,主要用来梳理思路,并没有多少思考,我尽量会在后期多弥补这方面的不足. 第1章 绪论 1.1 什么是数据挖掘 KDD: K nowle ...
最新文章
- java实现生产者消费者问题(转)
- 深度剖析RabbitMQ可靠性消息投递以及实践方案
- postgresql 9.1 暂停 stream 后使用 rsync 异机同步文件
- Ext js call方法
- 十四、MySQL函数相关知识总结(简单易懂)
- 【LeetCode笔记】剑指Offer 37. 序列化二叉树(Java、二叉树、序列化、BFS、队列)
- 盘点3款黑马小众数据库:适合的才是最好的
- HNU 实验七 字符串 E-mail地址
- IE下easyui 缓存问题
- Google 是这样的工作氛围
- Access2016学习16
- vue-cli 项目打包后 代理接口报404错误 解决办法!
- NLPcc2013-2014微博文本情感分类数据集
- 如何将土豆优酷视频插入到自己网站里
- 2020年育婴员(五级)报名考试及育婴员(五级)模拟考试题
- VCS+Verdi 安装及破解过程(Ubuntu)【1】
- 服务器 响应400,加载资源失败:服务器响应的状态为400:spring mvc
- 比基尼女郎助威世界杯
- win10系统更新服务器失败怎么回事,Win10总是更新失败怎么办?Windows更新出现更新失败的解决方法...
- ML:MLOps系列讲解之《设计机器学习驱动的(ML-powered)软件—我们想要解决的业务问题是什么?》解读