1. 数理统计的基本概念

基本思想: 数据⇒\Rightarrow⇒归纳⇒\Rightarrow⇒结果
定义: 数理统计是以概率论为基础, 关于实验数据的收集, 整理, 分析与推断的一种科学与艺术.

1.1. 数据的收集:

总体: 研究对象的全体称为总体
个体: 总体中每一个具体的对象称为个体

**例子1**: 分析某工厂灯泡的寿命 总体--该班厂所有灯泡的寿命 个体--每一个灯泡的寿命

总体: 研究对象的数量指标X $X\sim F(x)$ 个体: 总体X的可能取值

灯泡寿命的例子: **总体**--该厂所有灯泡的寿命X $$X\sim N(\mu, \sigma^2)$$ **个体**--每一个灯泡的使用寿命, 即X的一个可能取值

我知道部分个体的值, 能否预测总体?
假设灯泡服从X∼N(μ,σ2),如何预测μ和σX\sim N(\mu, \sigma^2), 如何预测\mu和\sigmaX∼N(μ,σ2),如何预测μ和σ

定义1: 从总体XXX中抽取的部分个体, 得到的数量指标X1,X2,...,XnX_1, X_2, ..., X_nX1​,X2​,...,Xn​, 若满足下条件:
(1) X1,X2,...,XnX_1, X_2, ..., X_nX1​,X2​,...,Xn​与XXX同分布;
(2) X1,X2,...,XnX_1, X_2, ..., X_nX1​,X2​,...,Xn​相互独立.
则称X1,X2,...,XnX_1, X_2, ..., X_nX1​,X2​,...,Xn​是来自XXX的一个简单随机样本, 简称样本

样本观测值: 对样本X1,X2,...,XnX_1, X_2, ..., X_nX1​,X2​,...,Xn​进行观测后, 得到的观测值: x1,x2,...,xnx_1, x_2, ..., x_nx1​,x2​,...,xn​称为样本的观测值.(注意: 小写字母为观测值, 大写字母为样本(随机变量))

样本的联合分布: 设总体X∼F(x)X\sim F(x)X∼F(x), 则样本X1,X2,...,XnX_1, X_2, ..., X_nX1​,X2​,...,Xn​的联合分布函数为:
F(x1,...,xn)=P{X1≤x1,...,Xn≤xn}=∏i=1nF(xi)F(x_1, ..., x_n)=P\{X_1\leq x_1, ..., X_n\leq x_n\}=\prod_{i=1}^{n}F(x_i) F(x1​,...,xn​)=P{X1​≤x1​,...,Xn​≤xn​}=i=1∏n​F(xi​)
若总体XXX的密度函数为f(x)f(x)f(x), 则样本X1,X2,...,XnX_1, X_2, ..., X_nX1​,X2​,...,Xn​的联合密度函数为(连续性):
f(x1,...,xn)=∏i=1nf(xi)f(x_1, ..., x_n)=\prod_{i=1}^n f(x_i) f(x1​,...,xn​)=i=1∏n​f(xi​)
若总体XXX的分布律为(离散型):P{X=ak}=pk,k=1,2,...P\{X=a_k\}=p_k, k=1,2, ...P{X=ak​}=pk​,k=1,2,...
则样本X1,X2,...,XnX_1, X_2, ..., X_nX1​,X2​,...,Xn​的联合分布律为:
P{X1=x1,X2=x2,...,Xn=xn}=P{X1=x1}∗P{X2=x2}...P{Xn=xn}=∏i=1nP{X=xi}P\{X_1=x_1, X_2=x_2, ..., X_n=x_n\}=P\{X_1=x_1\}*P\{X_2=x_2\}...P\{X_n=x_n\}=\prod_{i=1}^n P\{X=x_i\}P{X1​=x1​,X2​=x2​,...,Xn​=xn​}=P{X1​=x1​}∗P{X2​=x2​}...P{Xn​=xn​}=i=1∏n​P{X=xi​}

例子2: 设$X_1, X_2, ..., X_n$是来自总体$N(\mu, \sigma^2)$的样本, 则样本的联合密度函数为: $$f(x_1, x_2, ..., x_n)=\prod_{i=1}^n f(x_i)=\prod_{i=1}^n \frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{(x_i-u)^2}{2\sigma^2}}$$
例子3: 设$X_1, X_2, ..., X_n$是来自总体$B(1, p)$的样本, 则样本的联合分布函数为: $$P\{X_1=x_1, ..., X_n=x_n\}=\prod_{i=1}^n P{X=x_i}=\prod_{i=1}^{n}p^{x_1}p^{(1-x_i)}=p^{(\sum_{i=1}^n{x_i})}p^{\sum_{i=1}^n{(1-x_i)}}$$
样本与总体的关系:   总体  $\Downarrow$    $\Uparrow$ 样本 $\Rightarrow$ 样本值

1.2. 数据的整理:

统计量
定义2: 设X1,X2,...,XnX_1, X_2, ..., X_nX1​,X2​,...,Xn​是来自总体XF(x)X~F(x)X F(x)的样本, g(x1,x2,...,xn)g(x_1, x_2, ..., x_n)g(x1​,x2​,...,xn​)是n元实值连续函数, 若g(x1,x2,...,xn)g(x_1, x_2, ..., x_n)g(x1​,x2​,...,xn​)不含未知参数, 则称g(x1,x2,...,xn)g(x_1, x_2, ..., x_n)g(x1​,x2​,...,xn​)为统计量.

1.2.1 常见的统计量

设X1,X2,...,XnX_1, X_2, ..., X_nX1​,X2​,...,Xn​是来自样本X的样本, 则称:
(1)样本均值Xˉ=1n∑i=1nXi(2)样本方差S2=1n−1∑i=1n(Xi−Xˉ)2样本标准差S=1n−1∑i=1n(Xi−Xˉ)2(3)样本K阶原点矩Ak=1n∑i=1nXik(4)样本K阶中心矩Bk=1n∑i=1n(Xi−Xˉ)k(5)样本极大值,样本极小值,样本极差Rn=X(n)−X(1)\begin{aligned} (1)& 样本均值\bar X=\frac{1}{n}\sum_{i=1}^nX_i\\ (2)& 样本方差S^2=\frac{1}{n-1}\sum_{i=1}^n(X_i-\bar X)^2\\ &样本标准差S=\sqrt{\frac{1}{n-1}\sum_{i=1}^n(X_i-\bar X)^2}\\ (3)& 样本K阶原点矩 A_k=\frac{1}{n}\sum_{i=1}^nX_i^k\\ (4)& 样本K阶中心矩 B_k=\frac{1}{n}\sum_{i=1}^n(X_i-\bar X)^k\\ (5)& 样本极大值, 样本极小值, 样本极差 R_n=X_{(n)}-X_{(1)} \end{aligned}(1)(2)(3)(4)(5)​样本均值Xˉ=n1​i=1∑n​Xi​样本方差S2=n−11​i=1∑n​(Xi​−Xˉ)2样本标准差S=n−11​i=1∑n​(Xi​−Xˉ)2​样本K阶原点矩Ak​=n1​i=1∑n​Xik​样本K阶中心矩Bk​=n1​i=1∑n​(Xi​−Xˉ)k样本极大值,样本极小值,样本极差Rn​=X(n)​−X(1)​​

1.2.2 样本均值与样本方差的数字特征

命题1: 设X1,X2,...,XnX_1, X_2, ..., X_nX1​,X2​,...,Xn​是来自总体XF(x)X~F(x)X F(x)的样本, 且总体的均值与方差存在, 记为:
E(X)=μ,D(X)=σ2E(X)=\mu, D(X)=\sigma^2E(X)=μ,D(X)=σ2
则有:
(1)E(Xˉ)=μ,D(Xˉ)=1nσ2(2)E(S2)=σ2(1)E(\bar X)=\mu, D(\bar X)=\frac{1}{n}\sigma^2\\ (2) E(S^2)=\sigma^2 (1)E(Xˉ)=μ,D(Xˉ)=n1​σ2(2)E(S2)=σ2
证明:
已知E(X)=μ,D(X)=σ2E(X)=\mu, D(X)=\sigma^2E(X)=μ,D(X)=σ2
(1)E(Xˉ)=E(1n∑i=1nXi)=1n∑i=1nE(Xi)=1n∗nμ=μD(Xˉ)=D(1n∑i=1nXi)=1n2∑i=1nD(Xi)(此步用到独立同分布)=1n2∗σ2\begin{aligned} (1) E(\bar X)&=E(\frac{1}{n}\sum_{i=1}^{n}X_i)\\ &=\frac{1}{n}\sum_{i=1}^{n}E(X_i)\\ &=\frac{1}{n}*n\mu=\mu\\ D(\bar X)&=D(\frac{1}{n}\sum_{i=1}^{n}X_i)\\ &=\frac{1}{n^2}\sum_{i=1}^{n}D(X_i)(此步用到独立同分布)\\ &=\frac{1}{n^2}*\sigma^2 \end{aligned}(1)E(Xˉ)D(Xˉ)​=E(n1​i=1∑n​Xi​)=n1​i=1∑n​E(Xi​)=n1​∗nμ=μ=D(n1​i=1∑n​Xi​)=n21​i=1∑n​D(Xi​)(此步用到独立同分布)=n21​∗σ2​

(2) 先推导一个公式
∑i=1n(Xi−Xˉ)2=∑i=1nXi2−nXˉ2左边=∑i=1n(Xi2−2XiXˉ+Xˉ2)=∑i=1nXi2−2∑i=1nXiXˉ+∑i=1nXˉ2=∑i=1nXi2−2Xˉ∑i=1nXi+nXˉ2=∑i=1nXi2−nXˉ2\begin{aligned} \sum_{i=1}^n(X_i-\bar X)^2&=\sum_{i=1}^n X_i^2-n\bar X^2\\ 左边&=\sum_{i=1}^n(X_i^2-2X_i\bar X+\bar X^2)\\ &=\sum_{i=1}^n X_i^2-2\sum_{i=1}^n X_i\bar X+\sum_{i=1}^n \bar X^2\\ &=\sum_{i=1}^n X_i^2-2\bar X\sum_{i=1}^n X_i+n\bar X^2\\ &=\sum_{i=1}^n X_i^2-n\bar X^2 \end{aligned}i=1∑n​(Xi​−Xˉ)2左边​=i=1∑n​Xi2​−nXˉ2=i=1∑n​(Xi2​−2Xi​Xˉ+Xˉ2)=i=1∑n​Xi2​−2i=1∑n​Xi​Xˉ+i=1∑n​Xˉ2=i=1∑n​Xi2​−2Xˉi=1∑n​Xi​+nXˉ2=i=1∑n​Xi2​−nXˉ2​
然后证明公式:
E[∑i=1n(Xi−Xˉ)2]=E[∑i=1nXi2−nXˉ2]=∑i=1nE(Xi2)−nE(Xˉ2)=∑i=1n[D(Xi)+E(Xi)2]−n[D(Xˉ)+E(Xˉ)2]=nσ2+nμ2−n∗1nσ2−n∗μ2=(n−1)σ2(2)\begin{aligned} E[\sum_{i=1}^n(X_i-\bar X)^2]&=E[\sum_{i=1}^n X_i^2-n\bar X^2]\\ &=\sum_{i=1}^n E(X_i^2)-nE(\bar X^2)\\ &=\sum_{i=1}^n [D(X_i)+E(X_i)^2]-n[D(\bar X)+E(\bar X)^2]\\ &=n\sigma^2+n\mu^2-n*\frac{1}{n}\sigma^2-n*\mu^2\\ &=(n-1)\sigma^2 \end{aligned}\tag{2}E[i=1∑n​(Xi​−Xˉ)2]​=E[i=1∑n​Xi2​−nXˉ2]=i=1∑n​E(Xi2​)−nE(Xˉ2)=i=1∑n​[D(Xi​)+E(Xi​)2]−n[D(Xˉ)+E(Xˉ)2]=nσ2+nμ2−n∗n1​σ2−n∗μ2=(n−1)σ2​(2)
最后得到:
E(S2)=E(1n−1∑n−11(Xi−Xˉ)2)=1n−1E(∑n−11(Xi−Xˉ)2)=1n−1∗(n−1)σ2=σ2\begin{aligned} E(S^2)&=E(\frac{1}{n-1}\sum_{n-1}^{1}(X_i-\bar X)^2)\\ &=\frac{1}{n-1}E(\sum_{n-1}^{1}(X_i-\bar X)^2)\\ &=\frac{1}{n-1}*(n-1)\sigma^2\\ &=\sigma^2 \end{aligned}E(S2)​=E(n−11​n−1∑1​(Xi​−Xˉ)2)=n−11​E(n−1∑1​(Xi​−Xˉ)2)=n−11​∗(n−1)σ2=σ2​

上面的结果说明了什么?

1. 数理统计---数理统计基本概念相关推荐

  1. 详解数据科学与数理统计的基本概念

    导读:数据分析要熟练掌握数据科学与数理统计的基本概念. 作者:张秋剑 张浩 周大川 常国珍 来源:大数据DT(ID:hzdashuju) 01 数据科学的基本概念 随着计算机技术的发展和有用数据的快速 ...

  2. 李永乐复习全书概率论与数理统计 第五、六章 大数定律和中心极限定理及数理统计的基本概念

    目录 第五章  大数定律和中心极限定理 第六章  数理统计的基本概念 6.1  总体.样本.统计量和样本数字特征 例4  设总体X∼P(λ)X\sim P(\lambda)X∼P(λ),则来自总体XX ...

  3. 应用概率统计-第七章 数理统计的基本概念

    目录 一.基本概念: 二.常见的统计量: 三.抽样分布 概率论与数理统计都是从数量上研究随机现象的规律性的数学学科.但数理统计以概率论为基础,更着重于根据试验得到的数据来对研究对象的客观规律作出种种合 ...

  4. 概率论与数理统计(第六章-数理统计的基本概念

    文章目录 主要内容 串串本章的知识 主要内容 Statistics Sufficient Statistics Common Statistics and Distributions Normal d ...

  5. 【概率论基础进阶】数理统计的基本概念-常用统计分布

    文章目录 χ 2 \chi^{2} χ2分布 性质 t t t分布 性质 F F F分布 性质 正态总体的抽验分布 一个正态总体 两个正态总体 χ 2 \chi^{2} χ2分布 定义:设随机变量 X ...

  6. 【数理统计】数理统计的基本概念

    文章目录 选择题 填空题 选择题 设总体 X 的密度函数为 f ( x ) = 1 2 e − ∣ x ∣ , − ∞ < x

  7. 概率论与数理统计の笔记

    概率论应用范围主要是人工智能,和现在大数据背景下的数据处理 概率论考前总结 数学总目录 参考教材: <概率论与数理统计浙大版> <考研数学复习全书> 第一章 随机事件与概率 第 ...

  8. 概率论 方差公式_概率论与数理统计课程教学、学习基本要求和教学建议

    点"考研竞赛数学"↑可每天"涨姿势"哦! 工科类本科数学基础课程教学基本要求 概率论与数理统计部分 各门课程的内容按教学要求的不同,都分为两个层次.文中用黑体字 ...

  9. 概率论由相关性求数学期望和方差的公式_2020.3.30 | 考研数学—概率论与数理统计:各章节考试重点...

    考研数学有两大重点,基础要打好,练习要多做,错题要巩固.下面来看下有关概率论与数理统计相关复习内容,一起来学习吧! 一.概率与数理统计学科的特点(1)研究对象是随机现象高数是研究确定的现象,而概率研究 ...

  10. 概率论与数理统计复习

    文章目录 第一章 随机事件及其概率 随机事件 频率与概率 古典概型与几何概型 条件概率与事件的独立性 全概率公式与贝叶斯公式 第二章 随机变量及其分布 随机变量的概念 常用分布表(随机变量的离散连续与 ...

最新文章

  1. Hadoop 分布式环境搭建
  2. 字节流InputStream/OutputStream
  3. c+和python先学哪个比较好-python和c,应该先学哪个?
  4. 让容器跑得更快:CPU Burst 技术实践
  5. nodejs和python和php_PHP和Nodejs能配合使用吗?
  6. 青岛三网融合试点:三屏合一切入
  7. Linux命令TOP TEN
  8. Android 微信分享图片
  9. Android源码解析:UI绘制流程之测量.md
  10. 利用dao传值给mysql_koa+mysql+vue+socket.io全栈开发之数据访问篇
  11. shapley值法 - 用边际收益衡量每个人的贡献
  12. B00002 C语言位字段实例
  13. PyTorch绘制训练过程的accuracy和loss曲线
  14. PLT图纸外发控制系统
  15. NR小区搜索(一)SSB
  16. flex布局,没有justify-self,如何实现一左一中布局
  17. 传统目标跟踪——卡尔曼滤波Kalman(结合MeanShift+Kalman)
  18. html div 内部居中。
  19. SQL语句教程-------SQL语法
  20. vue省市区镇四级联动

热门文章

  1. 解决:无法加载文件 C:\Users\user\AppData\Roaming\npm\npx.ps1,因为在此系统上禁止运行脚本 。
  2. matlab各向异性高斯核方向导数滤波器,基于各向异性高斯方向导数滤波器提取图像粗边缘的方法...
  3. 港中文深圳校区计算机研究生怎么样,港中文(深圳)就业报告:应届生年薪40万!这所学校值得读吗?...
  4. WORD文档未保存就关闭的解决方法
  5. 干货 | 还不了解中介调节模型?赶紧收藏本文吧。
  6. 中学生科技节活动计算机,2018年学校科技节活动
  7. 【语义分割项目实战】一种特殊的数据增强方式:copy-paste实战复现
  8. 符号_特殊符号大全狐狸符号加字和复制
  9. 【Vue】以登录token为例,理解vuex状态管理使用
  10. 分享2022年淘宝/天猫/京东618自动任务助手,带抢购功能源码