学习笔记
学习书籍:《统计学:从数据到结论》-吴喜之;
参考书目:《统计学》-贾俊平


用估计量估计总体参数

我们都知道样本的函数称之为统计量,而用于估计的统计量则被称为估计量。由于统计量对于不同的样本取值不同,所以估计量就是随机变量,并有其分布。如果样本已经得到,把数据带入后,估计量就有了一个数值,也就不是随机的了,这个数值就是该估计量的一个实现或取值,也称为一个估计值。

点估计和区间估计

这里介绍两种估计,一种是点估计,也就是用估计量的实现值来近似相应的总体参数。另一种是区间估计,它是包括估计量在内的一个区间,该区间很有可能包含总体参数。

点估计

任何统计量,只要人们觉得合适就可以当成估计量。我们知道的最常用的估计量就是:样本均值、样本标准差等。

那么什么是好估计量的标准呢?一种统计量称为无偏估计量。所谓无偏性,就是:虽然每个样本产生的估计量的取值不一定等于参数,但当抽取大量样本时,那些样本产生的估计量的均值会接近真正要估计的假定分布的参数。严格来说,如果估计量的数学期望等于欲估计的总体参数,则该估计量称为该参数的无偏估计量。因此,无偏性仅仅是非常多次重复抽样时的一个渐进概念。在无偏估计量中,人们还希望找寻方差最小的估计量,称为最小方差无偏估计量,方差小则说明反复抽样产生的许多估计值差别不大,因此更加精确。

区间估计

当描述一个人的身高时,我们不会说,某人高180.2cm,而可能会说,某人身高在175 ~ 185之间,这时,我们提供的这个范围就是某种区间估计。在抽样调查中,我们也常用到点估计加区间估计的说法。比如:某人的支持率为80%,误差为±4\pm 4±4 %,置信度为95%.

这种说法意味着:支持率为80%是样本比例作为总体比例ppp的点估计; 估计范围在80%±4\pm 4±4%,即区间为(76%, 84%); 如果以类似的方式,重复大量抽取样本,产生的大量区间中,有些会覆盖真正的总体比例ppp,而有些则不会,但这些区间中大约有95%会覆盖真正的总体比例。

这样得到的区间,被称为总体比例ppp的置信度为95%的置信区间,这里的置信度又称为置信水平或置信系数。显然,置信度又是一个大量重复抽样时的渐进概念。

在这里,我们得到的区间(76%, 84%)是固定的,而总体比例ppp也是固定的,只不过未知而已。因此只有两种可能,要么这个区间包含总体比例ppp,要么不总体比例ppp,这当中没有概率可言。

事实上,置信区间都是由统计量来确定的,依样本而变,是随机变量。因此,可以说,构造置信度为100*(1-α\alphaα)%的随机区间,以1-α\alphaα的概率覆盖待估参数,但该区间相应于一个样本的实现值,就是固定的了,无法知道其是否真正覆盖需要估计的参数。

《统计学:从数据到结论》学习笔记(part3)--任何统计量,只要人们觉得合适就可以当成估计量相关推荐

  1. 《R数据科学》学习笔记|Note5:使用dplyr进行数据转换(下)

    点击蓝字 关注我! 写在前面 本系列为<R数据科学>(R for Data Science)的学习笔记.相较于其他R语言教程来说,本书一个很大的优势就是直接从实用的R包出发,来熟悉R及数据 ...

  2. 斯坦福大学数据可视化课程学习笔记:第一节 可视化的发展与目标

    <斯坦福大学数据可视化课程学习笔记>课程资源来自于斯坦福大学数据可视化课程,是我所在团队实习生提升计划的一部分.本系列是 "秉姝" 同学在学习过程中记录和整理的学习笔记 ...

  3. 斯坦福大学数据可视化课程学习笔记:第二节 从数据到图像

    <斯坦福大学数据可视化课程学习笔记>课程资源来自于斯坦福大学数据可视化课程,是我所在团队实习生提升计划的一部分.本系列是 "秉姝" 同学在学习过程中记录和整理的学习笔记 ...

  4. 大数据Hadoop教程-学习笔记01【大数据导论与Linux基础】

    视频教程:哔哩哔哩网站:黑马大数据Hadoop入门视频教程,总时长:14:22:04 教程资源:https://pan.baidu.com/s/1WYgyI3KgbzKzFD639lA-_g,提取码: ...

  5. 《R数据科学》学习笔记|Note8:使用dplyr处理关系数据

    使用dplyr处理关系数据 往期文章 <R数据科学>学习笔记|Note1:绪论 <R数据科学>学习笔记|Note2:使用ggplot2进行数据可视化(上) <R数据科学& ...

  6. 大数据Hadoop教程-学习笔记02【Apache Hadoop、HDFS】

    视频教程:哔哩哔哩网站:黑马大数据Hadoop入门视频教程 教程资源:https://pan.baidu.com/s/1WYgyI3KgbzKzFD639lA-_g 提取码: 6666 [P001-P ...

  7. hadoop大数据开发技术学习笔记第三天:(前序)MySQL数据库进阶

    hadoop大数据开发技术学习笔记第三天:(前序)MySQL数据库进阶 一.回顾知识 1.myschool数据库和数据表的创建 (1)创建数据库 (2)数据库模型图 (3)创建数据表grand (4) ...

  8. 金融风控-贷款违约预测学习笔记(Part3:特征工程)

    金融风控-贷款违约预测学习笔记(Part3:特征工程) 1.特征预处理 1.1 处理类别型特征和数值型特征 1.2 缺失值填充 1.3 时间格式处理 1.4 将对象类型特征转换到数值 1.5 类别特征 ...

  9. oracle数据变化记录,学习笔记:Oracle伪列函数ora_rowscn 记录表中行数据的修改时间...

    天萃荷净 Oracle数据库开发时使用伪列函数ora_rowscn查询出数据库表中行数据的修改时间 一.默认情况下 –创建t_orascn测试表 SQL> create table t_oras ...

最新文章

  1. 解决Python memory error的问题--扩充虚拟内存
  2. Expressions are not allowed at the top level
  3. 2021-11-15UA OPTI512R 傅立叶光学导论20 夫琅禾费衍射
  4. Activiti源码 ProcessEngineConfiguration
  5. Java的并发编程中的多线程问题到底是怎么回事儿?
  6. 做了三年Java,docker网络映射配置
  7. 互联网公司各种“花式”裁员,套路特别深,作为程序员你知道吗?
  8. Python使用数学形态学腐蚀运算删除验证码图片中的干扰噪点和线条
  9. 20190827 On Java8 第十四章 流式编程
  10. knx智能照明控制系统电路图_智能照明控制系统(KNX)讲解
  11. matlab 峰值位置,在数据中查找峰值 - MATLAB Simulink - MathWorks 中国
  12. 离线强化学习总结!(原理、数据集、算法、复杂性分析、超参数调优等)
  13. Python网络数据爬取及分析-智联招聘
  14. 百万调音师—Audition 压缩效果器
  15. vue 实现扫条形码与二维码 H5 兼容 苹果IOS
  16. 技术分享 | mimikatz的常见使用方法
  17. 淘客未来新趋势:自媒体淘客!
  18. Xcode工程文件无法打开
  19. Charles(弱网测试、断点测试、压力测试)
  20. 通过Excel表格批量导入数据

热门文章

  1. 2.6 矩阵乘法重要特例
  2. activity 防止多次打开_杭州下沙罐式无负压供水设备防止水质污染变频电泵
  3. PHP中的Trait方法
  4. centos内核编译与其签名机制
  5. 远程连接MySql数据库
  6. 使用c:forEach 控制5个换行
  7. 2016/12/3-问鼎杯线上赛1-1-Misc
  8. Node.js与Sails~Model和ORM的持久化
  9. [Everyday Mathematics]20150113
  10. linux下nginx启动停止重启控制脚本