数学:概率论与数理统计
前言
这篇博客是对《马同学——概率论与数理统计》以问答形式的总结。
文章目录
- 一、概率论的基本概念
- 二、随机变量
- 三、多维随机变量及其分布
- 四、随机变量的数字特征
- 五、大数定律与中心极限定理
- 六、数理统计的基本概念
- 七、参数估计
- 八、假设检验
一、概率论的基本概念
- 概率论起源于什么现象,该现象有什么特点?,小节1
概率论起源于随机现象。它(1)充满不确定性。(2)但结果又有迹可循。
- 试描述赌徒事件,其中的争议,以及涉及到的人物,最后如何解决, 小节2-小节3
问题双方: 梅累骑士与尼古拉斯(化名)
问题解决: 帕斯卡与费马
- 试举例说明什么是真随机,什么是伪随机。
真随机: 薛定谔的猫,状态本身不可预测
伪随机: 掷骰子,若给定所有限时条件,可以解出是那一面。
- 概率的几大学派,他们各自的观点,他们各自观点的优点和缺点?
频率派: 认为随机现象多次试验结果具有稳定性,当试验次数足够大,就得到概率。
古典派: 不充分理由原则(伯努利), 未知的概率都为等概率(拉普拉斯).
主观派: 认为概率是"信念强度"
- 古典派确定概率的原则是什么,涉及到哪些人物?, 小结4、5
不充分理由原则(伯努利), 未知的概率都为等概率(拉普拉斯).
- 什么是样本空间?什么是样本点?什么是事件?什么是事件的发生?,小节5,6,7
样本空间: 包含所有样本的集合。
样本点: 样本空间中的样本点。
事件: 样本空间的某个子集。
事件的发生: 事件中的某个样本点出现。
- 概率公理化的三个公理是什么?概率公理化的核心思想是什么?, 小节1,2
非负性公理、规范性公理、可加性公理。
核心思想是把概率P定义为一个函数。
- 为什么说概率函数的定义能够使得概率论在各大派别之间保持中立?, 小节3
因为定义的概率函数为抽象函数,可以使用不同派别的计算方式进行计算。
- 不可能事件发生概率为0,既符合常理,也是概率论严格数学上的推论,小节8
- 容斥原理?,小节8
- 古典派的重要假设是什么?如何通过概率公理化定义概率, 小节1
- 试通过路线选择解释概率的乘法原理讲先后,加法原理讲选择, 小节4,5
- 试距离说明古典派观点计算概率时,样本空间选择的重要性, 小节8
- 我们熟悉的条件概率公式是柯尔莫哥洛夫形式上符合现实的定义,但是并不是唯一定义,并不代表真理, 小节2
- 条件概率和概率公式的相似性、差异性在哪里。小结2,4
- 什么是基本比谬误?试举两个例子说明, 小节1,2
- 如何从基本比-确诊率,先验概率-后验概率,贝叶斯-全概率公式由因溯果3个方面理解贝叶斯原理, 小节3,8
- 试说明赌徒谬误是什么,它错在哪里?, 小节3
- 多事件独立的条件是什么?波罗梅奥环说明了多事件独立的什么关系?, 小节4,5
二、随机变量
- 如何理解随机变量的本质是定义在样本空间上的实值函数,小节3。
- 如何理解X≤xX \leq xX≤x和X=xX = xX=x,小节3。
- 如何理解伯努利分布是判断是非题,它的概率密度函数是什么?,小节3。
- n重伯努利实验对应的是什么分布,特点是什么,概率密度函数是什么?, 小节4,5。
对应随机变量的二项分布,分布可记做X∼b(n,p)X \sim b(n, p)X∼b(n,p)。(其中"n"为得到是的次数,"p"为得到是的概率)。特点是任意两次实验之间独立,概率密度函数为(nk)pk(1−p)1−k\binom{n}{k}p^k(1-p)^{1-k}(kn)pk(1−p)1−k。
- 概率质量函数和累积分布函数(CDF)是什么,小节1, 小节7。
- 如何通过期望来求解赌徒事件中奖金分配问题。, 小节2。
- 是准确描述数学期望的定义,以及其的限制条件,小节3。
- 如何从杠杆原理理解期望是"不确定性到确定性的桥梁"的意义, 小节4。
- 如何从重心理解期望的"加权平均"意义以及概率质量函数为什么叫概率质量函数。小节5.
值: 力矩,概率: 质量。期望: 所有力矩*质量的和,即重心所在位置(所有概率质量和为1)。这也是期望被称作一阶矩的原因。
- 期望满足
齐次性
和可加性
,因此是线性函数,可以直接使用线性代数的结论。 - 二项分布的期望为npnpnp.
- 试描述用期望指导二战征兵验血的过程。 小节7.
- 什么是辛普森悖论,如何从向量观点理解。小节8.
- 如何从打靶理解该式:S=(X1−Xˉ)2+(X2−Xˉ)+...+(Xn−Xˉ)nS = \frac{(X_1 - \bar{X})^2 + (X_2 - \bar{X}) + ...+ (X_n-\bar{X})}{n}S=n(X1−Xˉ)2+(X2−Xˉ)+...+(Xn−Xˉ)。
- Var(X)=E(X2)−u2,Var(c)=0,Var(aX+b)=a2Var(X)Var(X) = E(X^2)-u^2,Var(c) = 0, Var(aX+b)=a^2Var(X)Var(X)=E(X2)−u2,Var(c)=0,Var(aX+b)=a2Var(X)
- 从不充分理由原则理解二项分布方差最大时,p=12p=\frac{1}{2}p=21,小节6
- 马尔科夫不等式是由什么进行估计,回想巨人国的例子并推出马尔科夫不等式。
- 切比雪夫不等式是由什么进行估计的,回忆其推导过程以及其图像。, 小节8。
- 泊松分布是二项分布的极限,泊松分布的形式是什么,试推导泊松分布, 小节1-4
- 泊松分布的三个条件是什么?生活中常见的满足泊松分布的场景有哪些?. 小节5.
- 什么是帕斯卡分布, 试描述著名的巴拿赫火柴问题, 小节3
- 负二项分布和几何分布的关系是什么?,小节4
- 超几何分布是什么,它和二项分布的差别是什么?, 小节6
- 描述所有常见的离散分布,以及他们的物理模型。, 小节7
- 正太分布起源于什么,如何理解中心极限定理。. 小节1,2,3
- 考试成绩符合正太分布吗?为什么?, 小结3.
- 上α\alphaα分位点是什么?, 小节5.
- 六西格玛原则具体指什么,如何应用到生产当中。, 小节7.
- 泊松过程是如何从泊松分布推广定义的?, 小节3
- 如何使用泊松过程引出指数分布,并说明为什么灯泡寿命服从指数分布。, 小节4.
- 指数分布的期望物理意义是什么?, 小节5.
- 指数分布的无记忆性, 小节6.
- 几何分布和指数分布是唯二的无记忆性的分布。
- 试说明各大重要分布以及各分布之间的联系。,小节8.
- 累积分布函数的三个性质是什么?, 小结2
- 如何使用逆采样变换结合随机分布来采样符合指数分布的实例, 小节7.
- 如何理解随机变量函数的概率密度函数求解定理?, 小节6.
p(x)∣dx∣=p(y)∣dy∣→p(y)=p(x)∣dx∣∣dy∣=p(h(y))∣h′(y)∣p(x)|dx| = p(y)|dy| \to p(y)=p(x)\frac{|dx|}{|dy|}=p(h(y))|h'(y)|p(x)∣dx∣=p(y)∣dy∣→p(y)=p(x)∣dy∣∣dx∣=p(h(y))∣h′(y)∣
- 编程实现各大分布。
三、多维随机变量及其分布
- 随机向量的定义是怎样的,试举一个例子进行说明?,小节1.
- 如何使用均匀分布求解布什投针问题?,小节5
- 随机变量相互独立的条件是什么?, 小节5
- 全概率和贝叶斯公式的概率密度函数形式是怎样的?, 小节5.
- 离散场合和连续场合的卷积公式是怎样的。它们为什么叫做卷积?小节2.
- 伯努利,二项,几何,正态是如何通过分布的和串起来的.小节3.
- 随机变量分布的极值?,小节5
四、随机变量的数字特征
- 期望是线性函数,满足齐次性和可加性,本质上是因为积分是线性函数。
- 利用期望的线性性质解如下题.小节4
在一个口袋中装有m个颜色各不相同的球,每次从中任取一个,有放回的摸取n次,以X表示在n次摸球中摸到球的不同颜色的数目,求E(X)。
- 施瓦瓷不等式。小节5.
- 如何使用示性函数简化超几何分布期望计算?。小节6.
- 独立随机变量的方差计算 ?。小节5
- 如何通过矩形的面积来理解相关性?。小节2
- 如何简化矩形面积的计算并推算出协方差, 协方差的物理意义是什么?。小节3
- Cov(X,Y)=E(XY)−E(X)E(Y)Cov(X,Y) = E(XY)-E(X)E(Y)Cov(X,Y)=E(XY)−E(X)E(Y)
- 相关系数如何计算,引出的原因是什么?。小节6.
- 相关系数描述的是线性相关的程度。小节7
- 二维正态分布,不相关⇔\Leftrightarrow⇔独立。小节9
五、大数定律与中心极限定理
- 伯努利大数定律描述了什么?如何证明?,小节1。
- 依概率收敛和数列极限的区别是什么,为什么大数定律需要用依概率收敛表示?, 小节2。
- 辛钦大数定律指的是什么,需要满足什么条件?, 小节3。
- 切比雪夫大数定律指的是什么?需要满足什么条件?, 小节4
- 大数定律总结:
- 描述中心极限定理, 他需要满足的条件是什么?, 小节3
- 从高尔顿钉板、分布演化理解为什么大量分布叠加会收敛于正态分布,小节4
- 中心极限定理有更宽松的条件,只需要满足独立即可
六、数理统计的基本概念
如何理解"统计"是"概率"的逆向操作?, 小节1.
统计中的"总体"、“个体”、"样本"指的什么?,小节2,3
总体:所有测试结果。个体:每一次的测试结果。样本: 从总体中抽取出的n个个体。
如何理解样本通常记作X1,X2,...,XnX_1,X_2,...,X_nX1,X2,...,Xn, 样本具有随机性和确定性?, 小结3
简单随机样本的两个特点?, 小节4
样本中的个体互相独立,样本与总体同分布。
统计量:完全由样本决定的量叫做统计量。小节1
如果样本满足独立且和总体同分布,那么根据辛钦大叔定理,可以通过Xˉ=X1+X2+...+Xnn\bar{X} = \frac{X_1+X_2+...+X_n}{n}Xˉ=nX1+X2+...+Xn估计总体均值uuu。
安斯库姆四重奏是怎样的,说明了什么问题?,小节5。
如何理解统计量本身也是随机变量,所以也具有分布?, 小节1。
抽样分布是指统计量的分布,三大抽样分布是那三大分布?, 小节2。
三大分布的作用和意义(待理解)
(1) 衡量统计量对真实分布参数的逼近靠谱程度(当样本数量不多,大数定律无法保证靠谱)。比如(n−1)S2σ2∼X2(n−1)\frac{(n-1)S^2}{\sigma^2} \sim \mathcal{X}^2(n-1)σ2(n−1)S2∼X2(n−1)(小节6), 自由度为n−1n-1n−1的卡方分布的概率密度图像我们知道,nnn是常数,那么我们就能够估算统计量S2S^2S2和σ2\sigma^2σ2的比值。
(2) 生活中大部分分布是高斯分布,进行参数的区间估计时,需要建立统计量和真实参数的关系,会用到抽样分布。
七、参数估计
- 估计量的定义是什么,点估计的定义是什么?小节1。
估计量θ^(X1,X2,...,Xn)\hat{\theta}(X_1,X_2,...,X_n)θ^(X1,X2,...,Xn)是统计量的特例,它是对未知参数θ\thetaθ的近似, 称θ^是θ\hat{\theta}是\thetaθ^是θ的点估计。
最大似然估计的思想是什么,它的完整定义是什么?, 小节6、7、8.
点估计包含矩估计和最大似然估计。
最大似然估计和矩估计计算结果不一定相同。
估计量的优劣性评价的3个指标,其中一致性、无偏性、有效性是什么?, 小节2,3,4
统计是工程学科,采用的估计量或者估计方法需要按实际问题确定。比如使用S2ˉ\bar{S^2}S2ˉ和S2S^2S2来估计σ2\sigma^2σ2, 两个估计量各有优势。
区间估计的引入原因是什么?, 小节1
如何理解 95% 置信区间?, 小节2.
抽样100次,构成100个区间,其中95个区间会包含要估计的参数。
置信区间的严格定义是什么?. 小节6.
估计目标: θ\thetaθ, 给定条件α\alphaα, 置信水平: 1−α1-\alpha1−α;找到: 置信下限(统计量):θ‾\underline{\theta}θ; 置信上限(统计量): θˉ\bar{\theta}θˉ; 置信区间:(θ‾,θˉ)(\underline{\theta},\bar{\theta})(θ,θˉ). 使得θ\thetaθ在置信区间的概率大于等于1−α1-\alpha1−α.
置信区间的计算步骤是什么,如何理解?, 小节4.
(1) 根据实际情况找到合适的常见分布。(建立统计量和估计参数的联系)
(2) 根据常见分布计算f(θ^,θ)f(\hat{\theta},\theta)f(θ^,θ)概率大于等于1−α1-\alpha1−α的最小区间
(3) 最后移项求解出θ\thetaθ的区间。如果有X∼N(u,σ2)X \sim N(u, \sigma^2)X∼N(u,σ2), 说明不同情况下要估计uuu和σ2\sigma^2σ2所使用的分布. 小节5
八、假设检验
假设检验理论发展与女士品茶故事,是哪位数学家提出得假设检验理论?试描述此故事, 小节1.
说明女士品茶单边假设检验的原假设H0H_0H0和备择假设H1H_1H1,以及进行单边假设检验的步骤, 小节2.
(1) 明确原假设、备择假设: H0H_0H0: X∼b(p,10),p≤0.5X \sim b(p,10), p\le 0.5X∼b(p,10),p≤0.5(不具备正确分辨的能力)。H1H_1H1: X∼b(p,10),p>0.5X \sim b(p,10), p>0.5X∼b(p,10),p>0.5(具备正确分辨的能力)。
(2)假定原假设成立。给出原假设边界(即p=0.5p = 0.5p=0.5)的概率密度图像(因为边界拒绝域包含了非边界拒绝域),根据概率密度函数确定拒绝域。
(3) 判断事实是否落入拒绝域,若落入,则拒绝H0H_0H0, 否则接受。假设的指定要符合什么原则?, 小节4
无罪推定、便于计算。
说明第一类错误和第二类错误是什么?我们应该首先控制哪一类错误?, 小节5
说明总体X∼N(u,σ2)X \sim N(u, \sigma^2)X∼N(u,σ2),当σ2\sigma^2σ2已知/未知时, uuu的双边检验和单边检验的方法, 小节1,小节2
说明总体X∼N(u,σ2)X \sim N(u, \sigma^2)X∼N(u,σ2),当uuu已知/未知时,σ2\sigma^2σ2的双边检验和单边检验的方法, 小节4
置信区间和假设检验的联系?(待理解)
假设检验的总结, 小节6.
数学:概率论与数理统计相关推荐
- 搞学术离不开的那些数学—概率论与数理统计
概率论与数理统计 声明:本博客仅作为学习.复习所用,该博客参考的教材为高等教育出版社出版的 浙江大学 第四版<概率论与数理统计>教材,并参考了四川大学 徐小湛老师的讲课视屏(再次声明本博客 ...
- 概率论由相关性求数学期望和方差的公式_2020.3.30 | 考研数学—概率论与数理统计:各章节考试重点...
考研数学有两大重点,基础要打好,练习要多做,错题要巩固.下面来看下有关概率论与数理统计相关复习内容,一起来学习吧! 一.概率与数理统计学科的特点(1)研究对象是随机现象高数是研究确定的现象,而概率研究 ...
- 概率统计及其应用第三章知识总结_2020考研数学概率论与数理统计:各章节考试重点分析...
考研数学有两大重点,基础要打好,练习要多做,错题要巩固.下面来看下有关概率论与数理统计相关复习内容,一起来学习吧! 一.概率与数理统计学科的特点 (1)研究对象是随机现象 高数是研究确定的现象,而概率 ...
- 概率统计在计算机中的重要性,概率论与数理统计在数一、数三中的重要性
概率论与数理统计在数学一.三的试卷中所占的比例均为22%,通过对2005-2014年考研的整理,将题目按照章节知识分类,统计得到如下各个章节在近十年出现的题目数量以及相应的分数,见下表: 注:黑色数字 ...
- 概率论 方差公式_【考研数学】概率论与数理统计
总论:概率论与数理统计这门课程,在考研真题中的难度是相对较小的:但由于它的概念繁杂,计算量较大,尤其是统计部分,很多同学在初学的时候都会被唬住,有的甚至放弃学概率.这种状态是要不得的,因为我总结这门课 ...
- 概率论与数理统计思维导图_数学思维到底有多重要?这个学科往往影响国家实力...
原标题:<关于加强数学科学研究工作方案>日前发布--数学思维今何在 密码学家王晓云日前获得了2019年未来科学大奖数学与计算机科学奖.她提出密码哈希函数的碰撞攻击理论,推动帮助新一代密码哈 ...
- 人工智能数学核心理论34讲精华视频免费领(微积分、概率论与数理统计、线性代数三部曲)
从事AI行业最重要的知识莫过于数学了,或者说对于计算机领域乃至工科领域都是很重要的. 对于大多数的新手来说,如何入手人工智能其实都是一头雾水,比如到底需要哪些数学基础.是否要有工程经验.对于深度学习框 ...
- python实现概率论与数理统计_《统计思维:程序员数学之概率统计》读书笔记
更多 1.书籍信息 书名:Think Stats: Probability and Statistics for Programmers 译名:<统计思维:程序员数学之概率统计> 作者:A ...
- 在线阅读!!机器学习数学精华:概率论与数理统计
机器学习,需要一定的数学基础,需要掌握的数学基础知识特别多,如果从头到尾开始学,估计大部分人来不及,我建议先学习最基础的数学知识,基础知识可以分为高等数学.线性代数.概率论与数理统计三部分,我整理了相 ...
- 概率论由相关性求数学期望和方差的公式_《概率论与数理统计》(公共课—计算机科学与技术本科专业)教学大纲(2017.2编)资料...
<概率论与数理统计>课程教学大纲 (2016版) 一.课程基本信息 课程名称:概率论与数理统计 英文名称:Probability Theory and Mathematical Stati ...
最新文章
- Servlet(一)
- 【单片机】时钟周期 器械周期 指令周期的关系
- 网络数据包信息收集工具ferret-sidejack
- VS Code识别编辑规范,ESlint规则,VS Code保存去掉自动加分号、逗号、双引号
- 从近期两篇论文看大规模商品图嵌入
- [Abp 源码分析]ASP.NET Core 集成
- Allegro padstack
- CAD库中列举所有航路点
- 【转】Dicom基础知识
- 案例 自动办公_1300张办公系列前台参考图,请您查收!
- PHP上传文件大小限制的问题(转)
- 《Linux命令行与shell脚本编程大全 第3版》Linux命令行---41
- win10家庭版添加组策略编辑器,禁用系统自动更新
- 用Java打印棱形的思路,java打印菱形思路
- Eclipse语言包在官网下载不了-解决方案
- 力扣 202 快乐数
- 三星s窗口共享android,使用 S 窗口共享轻松让您的三星手机连接电脑
- 你需要一个什么样的网站开发流程?
- 班级量化考核系统php代码,班级管理量化考核及评分细则
- ceph管理界面calamari(未成功)