推断统计是研究如何利用样本数据来推断总体特征的统计方法。包含参数估计和假设检验。

参数估计即利用样本信息推断总体特征,也就是根据样本数据来估计变量的概率分布,或者是总体分布所包含的未知参数的过程。
举个例子:要研究人们的市场消费行为,首先需要了解人们的收入状况,若某城市人均年收入数据服从正态分布,但参数的均值和方差的具体取值未知,此时就可以根据样本的来估计这两个参数。方法有点估计和区间估计。通俗理解,点估计就是得到具体取值,区间估计就有一个包括真实值的区间范围,称为置信区间。
假设检验:参数估计的主要任务是猜测参数的取值,而假设检验的着重点在于检验参数的取值是否等于某个目标值。比如先对总体的特征作出某种假设,然后通过抽样研究的统计推理,对此假设应该被拒绝还是接受做出判断。
假设检验有两个隐含的思想:小概率事件思想和反证法的思想。
小概率事件就是在我们的假设下如果出现了小概率事件,那么就可以否定我们的假设。
反证法就是先假设我们提出的假设是正确的,然后在这个条件下去观测发生的事件是否是小概率事件,如果是的话,则否定原假设。
假设检验的步骤:
1.提出原假设,记为H0,同时提出互为反命题的备择假设H1。
2.在H0正确的条件下,求出样本数据出现的概率,看是否是小概率事件
3.若小概率,认定原假设错误,称为拒绝原假设。否则不能拒绝原假设
对于原假设和备择假设有如下选择原则:
原假设应该是受保护的,不应轻易被拒绝;
备择假设是检验者所希望的结果;
等号永远出现在原假设中。
假设检验中出现的两类错误。
1.第一类错误:在假设检验中拒绝了本来是正确的原假设(弃真)。我们认为小概率事件是几乎不可能发生的,因此我们会拒绝原假设当出现小概率事件的时候,然而只要概率不等于0,那么事件都是有可能发生的,也就是说我们仍然有可能遇到小概率事件,但我们却拒绝他了。第一类错误的概率记为α
2.第二类错误:在假设检验中没有拒绝本来是错误的原假设(取伪)。原假设是错误的但却很接近真实值,可能是有一些偶然因素使然。第二类错误的概率β
这两类错误我们没办法同向优化,所以我们一般选择控制α,不限制β。
α是第一类错误的概率,也就是在H0为真的条件下,拒绝H0的概率,是一个条件概率
P(拒绝H0|H0为真),为了控制α,我们将它固定P(拒绝H0|H0为真)<=α
在统计学上,α叫做显著性水平,常见的值有0.1,0.05,0.025
接着为了确定一个事件是不是小概率事件,要求解此事件发生的概率。对于连续型变量, 某个具体取值的概率都为0,所以无法直接算概率,则使用另一种方法,即算出在原假设正确的条件下,和当前样本一样极端或更极端的情况出现的概率。举个例子,原假设总体均值为10,样本均值9,则差为-1,那么更极端就是指均值和10的差大于1或者小于-1的样本。因此,把所得到的样本或更极端的情况出现的概率叫做p值(p-value)。比如上面的例子,p-value就是均值小于等于9或者大于等于11的样本的概率。

推断统计--假设检验相关推荐

  1. 推断统计python化(参数估计,假设检验与 t检验)

    目录 1.参数估计 1.1 点估计 1.2 区间估计 1.2.1 区间估计概述 1.2.2 区间估计的方法 1.3 进行区间估计的Python函数 2. 案例分析 3. 假设检验 3.1 假设检验概述 ...

  2. 推断统计:参数估计和假设检验

    目录   1.总体.个体.样本和样本容量    1)总体.个体.样本和样本容量的概念    2)本文章使用的相关python库   2.推断统计的概念    1)推断统计的概念    2)为什么要进行 ...

  3. python做线性回归统计推断提取参数_概率分析方法与推断统计(来自我写的python书)...

    在数据分析统计的场景里,常用的方法除了描述性统计方法外,还有推断统计方法,如果再从工作性质上来划分,推断统计包含了参数估计和假设验证这两方面的内容.而推断统计用到了很多概率统计方法,所以本小节在介绍推 ...

  4. 概率分析方法与推断统计(来自我写的python书)

    在数据分析统计的场景里,常用的方法除了描述性统计方法外,还有推断统计方法,如果再从工作性质上来划分,推断统计包含了参数估计和假设验证这两方面的内容.而推断统计用到了很多概率统计方法,所以本小节在介绍推 ...

  5. 《大数据分析原理与实践》一一2.3 推断统计

    2.3 推断统计 推断统计是研究如何利用样本数据来推断总体特征的统计方法,其目的是利用问题的基本假定及包含在观测数据中的信息,做出尽量精确和可靠的结论.基本特征是其依据的条件中包含带随机性的观测数据. ...

  6. 计算统计-Chap6 推断统计的蒙特卡罗方法 (3)蒙特卡罗方法

    很多时候,我们不清楚统计量的分布,或不确定对它所作的假设是否合理.蒙特卡罗模拟可以处理这些情况,它的应用包括: 1)当待检测统计量(the test statistics)从未知时,进行推断 2)当参 ...

  7. 简明易懂的c#入门指南_统计假设检验的简明指南

    简明易懂的c#入门指南 介绍 (Introduction) One of the main applications of frequentist statistics is the comparis ...

  8. 计算统计-Chap6 推断统计的蒙特卡罗方法 (1)引言

    推断统计(inferential statistics)用于形成关于总体(population)的结论,并且利用随机样本对这些结论的可信度进行评价,相关技术包括:利用点估计来估计总体参数,估计参数的置 ...

  9. python假设检验平均,利用python进行17种统计假设检验

    请点击阅读原文,在语雀中查看 https://www.yuque.com/alipayqgthu1irbf/sharkfin/enrzni 翻译自 https://machinelearningmas ...

最新文章

  1. 索引的使用—— 验证索引提升查询效率 || 避免索引失效 —— 全值匹配 /最左前缀法则/范围查询右边的列,不能使用索引/不要在索引列上进行运算操作/字符串不加单引号,造成索引失效
  2. 文本 To 音频
  3. 烦人的Facebook分享授权
  4. C语言程序设计 练习1-13
  5. Visual Studio IDE环境下利用模板创建和手动配置CUDA项目教程
  6. HDU 3974 Assign the task(dfs时间戳+线段树成段更新)
  7. Linux进程全解4——fork创建子进程
  8. 顶级程序员的心得 Coders at Work (I)
  9. Eclipse alt+/ 失效 解决
  10. yum php5.6源码,5.2 YUM升级PHP5.6
  11. 支持向量机的基本原理
  12. CAM350简单编辑gerber文件(【增加一条线】 【复制元素】 【删除元素】)
  13. Android~adb卸载系统预装应用(亲测有效)
  14. realsenseD400系列相机报错:undefined symbol: _ZN2cv3MatC1EiiiRKNS_7Scalar_IdEE解决方案
  15. 越是聪明人越要懂得下笨功夫!
  16. Win10 文件夹删不掉,提示需要来自XXX的权限才能对此文件夹进行更改
  17. 【IoT】 产品设计:硬件产品经理核心能力培养
  18. python计算复数的辐角_Python机器学习(五十六)SciPy fftpack(傅里叶变换)
  19. 1.函数的结构,调用,传参,形参,实参,args,kwargs,名称空间,高阶函数
  20. 2022 年超详细过程步骤讲解 CentOS 7 安装Maven。以及Mavne配置文件的修改

热门文章

  1. 清华同方的计算机硬件设置,清华同方笔记本电脑开机进入BIOS的几种方法(F2)附bios设置图文方...
  2. 深度优先搜索(DFS)和广度优先搜索(BFS)两种算法c++
  3. c++定义一个简单的银行账户类
  4. struts1框架基本(笔记)
  5. python数据库迁移命令_创建和进行数据库迁移,同步数据库
  6. SQL窗口函数-聚合窗口函数
  7. nodejs+vue企业员工考勤管理系统java python php
  8. 分布式算法 - Raft算法
  9. 元宇宙:人类的“母体”
  10. web前端工资一般多少?在北京前端工程师多少钱一个月?