1. 点估计和区间估计

例如:刮刮卡

2. 置信区间

置信区间又称估计区间,是用来估计参数的取值范围的。在统计学中,一个概率样本的置信区间(Confidence interval)是对这个样本的某个总体参数的区间估计。

2.1 计算步骤

第一步:求一个样本的均值
第二步:计算出抽样误差。
人们经过实践,通常认为调查:
100个样本的抽样误差为±10%;
500个样本的抽样误差为±5%;
1200个样本时的抽样误差为±3%;
第三步:用第一步求出的“样本均值”加、减第二步计算的“抽样误差”,得出置信区间的两个端点。
置信区间=点估计±(关键值× 点估计的标准差)

2.2 性质

窄的置信区间比宽的置信区间能提供更多的有关总体参数的信息。
假设全班考试的平均分数为65分,则

置信区间 间隔 宽窄度 表达的意思
0-100分 100 等于什么也没告诉你
30-80分 50 较窄 你能估出大概的平均分了(55分)
60-70分 10 你几乎能判定全班的平均分了(65分)

2.3 置信水平

置信水平是指总体参数值落在样本统计值某一区内的概率。
假如设定的置信水平为95%,即做100次抽样,会有95个置信区间包含了总体平均值。

2.4 置信区间与置信水平、样本量的关系

(1)样本量对置信区间的影响:在置信水平固定的情况下,样本量越多,置信区间越窄。

实例分析:

由上表得出:
1、在置信水平相同的情况下,样本量越多,置信区间越窄。
2、置信区间变窄的速度不像样本量增加的速度那么快,也就是说并不是样本量增加一倍,置信区间也变窄一半(实践证明,样本量要增加4倍,置信区间才能变窄一半),所以当样本量达到一个量时(通常是1,200,如上例三个国家各抽了1,200个消费者),就不再增加样本了。

(2)置信水平对置信区间的影响:在样本量相同的情况下,置信水平越高,置信区间越宽。

2.5 实例分析

美国做了一项对总统工作满意度的调查。在调查抽取的1,200人中,有60%的人赞扬了总统的工作,抽样误差为±3%,置信水平为95%;如果将抽样误差减少为±2.3%,置信水平降到为90%。则两组数字的情况比较如下:

由上表得出:
在样本量相同的情况下(都是1,200人),置信水平越高(95%),置信区间越宽。

参考文章
https://www.zhihu.com/question/26419030
https://baike.baidu.com/item/%E7%BD%AE%E4%BF%A1%E5%8C%BA%E9%97%B4/7442583?fr=aladdin
http://www.360doc.com/content/18/0317/16/15033922_737796626.shtml

[统计学理论基础] 置信区间相关推荐

  1. 【数据分析】数据分析需要掌握的统计学理论基础知识

    数据分析需要掌握的统计学理论基础知识 最近在阅读徐麟老师的<数据分析师求职面试指南>,这本书系统性地描述了数据分析师的知识技能框架,非常值得阅读.对于一个数据分析师来说,统计学理论基础知识 ...

  2. [统计学理论基础] 方差 协方差 标准差

    统计里最基本的概念就是样本的均值.方差和标准差. 通过一个含有n个样本的集合,依次给出这些概念的公式描述. 均值描述的是样本集合的中间点,它告诉我们的信息是很有限的, 标准差描述的则是样本集合的各个样 ...

  3. [统计学理论基础] 中心极限定理与大数定律的区别

    一. 中心极限定理 下图形象的说明了中心极限定理 当样本量N逐渐趋于无穷大时,N个抽样样本的均值的频数逐渐趋于正态分布,其对原总体的分布不做任何要求,意味着无论总体是什么分布,其抽样样本的均值的频数的 ...

  4. 置信区间构建---商务与经济统计+深入浅出统计学

    目录 置信区间: 置信区间求解步骤: 置信区间求解: 总体均值的置信区间: 总体的标准差已知: 总体的标准差未知: 样本容量的确定 总体比率的置信区间 样本容量的确定 置信区间: 通过点估计量加减一个 ...

  5. 智源青年科学家张新雨:从模型平均到集成学习、迁移学习

    2020年2月11日上午,在 "智源论坛Live | 青年科学家线上报告会"中,智源青年科学家.中科院系统所研究员张新雨做了题为<模型平均.集成学习与迁移学习>的主题演 ...

  6. 机器学习-特征工程中的数据预处理

    对于一个机器学习问题,数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限.由此可见,数据和特征在模型的整个开发过程中是比较重要.特征工程,顾名思义,是对原始数据进行一系列工程处理,将其提炼为 ...

  7. 想学数据分析但不会Python,过来看看SQL吧(上)~

    作者:贾胜杰,硕士,退役军人,电气工程专业,现成功转行K12领域数据挖掘工程师,不仅在数据清理.分析和预测方向,而且在自制力和高效学习方面都有丰富经验. 编辑:王老湿 SQL SQL基础:语法,检索, ...

  8. 离群点(oulier)挖掘详解

    异常对象被称作离群点.异常检测也称偏差检测和例外挖掘. 常见的异常成因:数据来源于不同的类(异常对象来自于一个与大多数数据对象源(类)不同的源(类)的思想),自然变异,以及数据测量或收集误差. 异常检 ...

  9. 特征工程之数据预处理(下)

    机器学习入门系列(2)–如何构建一个完整的机器学习项目,第四篇! 该系列的前三篇文章: 机器学习入门系列(2)–如何构建一个完整的机器学习项目(一) 机器学习数据集的获取和测试集的构建方法 特征工程之 ...

  10. 机器学习——超参数调优

    超参数是在开始学习过程之前设置值的参数,而不是通过训练得到的参数数据.超参数可以分为两种类型:定义模型及结构本身的参数,目标函数与与优化算法所需的参数,前者用于训练和预测阶段,后者用于训练阶段. 在实 ...

最新文章

  1. C++类为什么使用private?------封装性
  2. 百度集团副总裁吴甜:技术创新持续为产业发展注入新动能|MEET2022
  3. AS3.0中is,as运算符
  4. [android] 隐式意图的配置
  5. SAP UI5加载时的library-preload.json文件
  6. SqlServer自定义排序
  7. 汇编语言中常见的标志位: CF, PF, AF, ZF, SF,TF,IF,DF, OF
  8. js react根据几个颜色点计算区间任意数值对应颜色
  9. json 潜逃 结构体_JSON还原为结构体
  10. sql还原数据库备份数据库_有关数据库备份,还原和恢复SQL面试问题–第IV部分
  11. C++基础之返回数组
  12. oracle数据库修改连接数
  13. 给物体赋值 只改变transform.position的某一维,访问另一个脚本的变量以及给物体用脚本动态添加属性
  14. echart层级圆饼图
  15. ★关于人类体质弱化的分析
  16. 爱签:行业利好不断 电子签章、电子合同将扩大应用
  17. python中getattr()函数用法详解
  18. 何为Robocode
  19. STM32——I2S简介硬件连接
  20. 第一本书 第九章 使用对象吃货联盟

热门文章

  1. 21个数据科学家面试必须知道的问题和答案
  2. ChromeFK插件推荐系列九:PDF插件推荐
  3. (zotero+坚果云+pdf expert+欧陆词典)实现PC平板同步阅读管理科研文献(完美教程)
  4. 狼人杀游戏 数据库设计
  5. DC-DC升压芯片MP9185
  6. 艾永亮:百果园的商业模式是什么?打造超级产品引领生鲜电商行业
  7. LM1875功放板设计实例
  8. 张云雷的《探清水河》登上央视,为什么蔡国庆可以随心所欲地唱
  9. 在Vue中使用highlight.js
  10. 如何免费下载卫星影像图