统计推断包括参数估计和假设检验。参数估计就是用样本指标(统计量)来估计总体指标(参数)。

一、参数估计基础-Z分布

在统计应用中,可以把任何一个均数为,标准差为的正态分布转变为,的标准正态分布,即将正态变量值来代替,由于服从正态分布,故服从标准正态分布,其中表示总体的标准差。

特点:总体的标准差是一定的。

二、参数估计基础-t分布

实际资料的分析中,由于往往未知,故标准化转换演变为:,服从分布,即:。其中表示样本的标准差,表示标准误。

统计学家发现,t分布的分布性状是与和样本量息息相关的自由度相对应的。

t 分布曲线特点:

  1. 分布曲线是单峰分布,它以0为中心,左右对称。
  2. 分布的形状与样本例数 (自由度)有关。自由度越小,则越大,值越分散,曲线的峰部越矮,尾部则偏高。
  3. 时,则 逼近 分布逼近标准正态分布。
  4. 分布不是一条曲线,而是一簇曲线。

三、参数估计基础-t转换和Z转换的不同

  1. 转换标准误在一个固定的上实现的转换。

  2. 转换是基于和每次抽样结果(为样本的标准差)有相关关系的标准差,所有相对于基于总体标准差来说,有一定的不确定性。

四、参数估计-点估计

样本统计量直接作为总体参数的估计值。

于2000年测得某地27例健康成年男性血红蛋白量的样本均数为125g/L,试估计其总体均数。

,即认为2000年该地所有健康成年男性血红蛋白量的总体均数为125g/L 。

缺陷:用样本均值测算总体均值完全相等几乎是不可能的,所以我们用一个范围去估计总体参数所在的位置(区间估计)。

五、参数估计-区间估计

按预先给定的概率估计总体参数的可能范围,该范围就称为总体参数的置信区间(confidence interval, CI) 。

预先给定的概率称为置信度,常取95%或99%。如无特别说明,一般取双侧95%。

置信区间由两个数值即置信限(下限和上限)构成。

置信水平是指总体参数值落在样本统计值某一区内的概率(成功率);而置信区间是指在某一置信水平下,样本统计值与总体参数值间误差范围。置信区间越大,置信水平越高。

1、总体均数的区间估计

以下是正态总体抽样得到的均数的分布规律,通过抽样得到的样本均数并不能原丝合缝的相等。

(1) 已知

按标准正态分布原理计算,由分布,标准正态曲线下有 95%的值在±1.96之间。

 简单运算之后转换为:   
        95%的双侧置信区间: 

99%的双侧置信区间: ,99%的双侧置信区间

通式:(双侧)

(2) 未知,样本例数足够大(

分布可知,自由度越大,分布越逼近标准正态分布,此时曲线下有 95%的值在±1.96之间,即:

 简单运算之后转换为:  
        95%的双侧置信区间: 

99%的双侧置信区间: 

通式:(其中表示样本标准差,表示样本含量,是基于样本标准差的标准误)(双侧)

某市2000年随机测量了90名19岁健康男大学生的身高,其均数为172.2cm,标准差为4.5cm,,试估计该地19岁健康男大学生的身高的95%置信区间。

该市19岁健康男大学生的身高的95%置信区间(171.3,173.1) cm。

注意:

并不能说该市19岁健康男大学生的平均身高有95%的概率落在区间 (171.3,173.1)里!即不能说这个区间有95%的概率覆盖总体均数。

这是由于平均身高作为总体均值,它是一个常数(客观存在),因此当区间估计完成以后,区间(171.3,173.1)要么覆盖总体均数,要么不覆盖。也就是说,概率为0或1,不会出现其它的概率值。

在一次具体的估计完成之前,一定样本量下的区间估计方法,假如能够重复很多次的话,将有较多的次数,例如95%的次数会成功,有5%的次数会失败,因为在我们完成具体的计算之前,实际上这个区间估计的上边界和下边界都还是随机变化的。

用大量来自同一总体的独立样本对总体均数做估计时,关于95%的置信区间(CI),正确的说法是:A

A.大约有95%的样本的CI覆盖总体均值

B.各个样本估计的CI是相同的

C.对于同一个CI而言,有95%的可能性覆盖总体均数————>>要么覆盖(100%),要么不覆盖(0%)

(3) 未知,且样本例数较小(

分布可知,此时某自由度的t曲线下约有 95%的值在之间,即:

 
       

95%的双侧置信区间: 

99%的双侧置信区间: 

通式:(其中表示样本标准差,表示样本含量,是基于样本标准差的标准误)(双侧)

已知某地27例健康成年男性血红蛋白量的均数为 ,标准差 ,试问该地健康成年男性血红蛋白量的95%和99%置信区间。

95%CI:

99%CI:

2、总体概率的区间估计

总体概率的置信区间与样本含量、阳性频率(二项分布)的大小有关,可根据的大小选择以下两种方法。

1、正态近似法

当样本含量足够大,且 不太小(通常 大于或等于5),则样本率的分布近似正态分布。

公式为:

为样本率, 为基于样本率的标准误,

例:用某种仪器检查已确诊的乳腺癌患者94例,检出率为78.3%。估计该仪器乳腺癌总体检出率的95%置信区间。

分析:本例样本例数较大,且样本率 不太小,可用正态近似法:

2、 查表法

较小,如≤50,特别是 和 接近0或1时,应按照二项分布的原理估计总体率的可信区间。

某医院对39名前列腺癌患者实施开放手术治疗,术后有合并症者2人,试估计该手术合并症发生概率的95%置信区间。

通过查表,该手术合并症发生概率的95%置信区间为[1%,17%]

统计推断—参数估计—点估计、区间估计、t分布、Z分布相关推荐

  1. 5.参数估计——点估计与区间估计概念,置信区间的公式求法与Python实现求出结果

    1.点估计 什么是点估计 设总体X的分布形式已知,但它的一个或多个参数未知,借助于总体X的一个样本来估计总体未知参数的值的问题称为参数的点估计问题 注意: 点估计的问题就是要构造一个适当的统计量(估计 ...

  2. #统计学相关,Z分布,推断性统计

    #统计学相关,Z分布,推断性统计 #推断性统计一般分三步走,1抽样,2对样本进行预测,3对结果进行评估(假设性检验) #在预测方面(即上第二步),有以下几种情况,点估计(就好比在一条线中,抽出线上的点 ...

  3. 各类分布----二项分布,泊松分布,负二项分布,gamma 分布,高斯分布,学生分布,Z分布...

    伯努利实验: 如果无穷随机变量序列  是独立同分布(i.i.d.)的,而且每个随机变量  都服从参数为p的伯努利分布,那么随机变量  就形成参数为p的一系列伯努利试验.同样,如果n个随机变量  独立同 ...

  4. t分布 u分布 卡方分布_中心极限定理|z分布|t分布|卡方分布

    生物统计学 抽样分布:n个样本会得到n个统计量,将这n个统计量作为总体,该总体的分布即是抽样分布 根据辛钦大数定律,从一个非正态分布的总体中抽取的含量主n的样本,当n充分大时,样本平均数渐近服从正态分 ...

  5. 从 高斯 到 正态分布 到 Z分布 到 t分布

    正态分布是如何被高斯推导出来的, 我感觉高斯更像是猜出了正态分布. 详见这篇文章:<正态分布的前世今生> http://songshuhui.NET/archives/76501 说一说理 ...

  6. 【机器学习】python机器学习使用scikit-learn对模型进行评估:使用t分布及z分布评估模型误差的95%置信空间

    端到端机器学习导航: [机器学习]python借助pandas加载并显示csv数据文件,并绘制直方图 [机器学习]python使用matplotlib进行二维数据绘图并保存为png图片 [机器学习]p ...

  7. 统计学中z分布、t分布、F分布及χ^2分布

    Z就是正态分布,X^2分布是一个正态分布的平方,t分布是一个正态分布除以(一个X^2分布除以它的自由度然后开根号),F分布是两个卡方分布分布除以他们各自的自由度再相除 比如X是一个Z分布,Y(n)=X ...

  8. 统计学两个分布:Z 分布和student-t 分布(假设检验Hypothesis test、置信区间Confidence interval)

    商业统计原理体会2: 回顾 Z 分布和student-t 分布 置信区间 假设检验 p-value 总结 回顾 上一次最后遗留了一个问题,将得到的sample用CLT视作正态分布,再通过标准化得到z值 ...

  9. Struggle to 搞懂统计学——点估计 区间估计 置信区间

    文章目录 点估计 区间估计 置信区间 理解 操作(重中之重) 总体方差已知 总体方差未知 假设检验 在统计学的应用过程中,总有那么几个重要的基础概念似懂非懂,就像雾里看花,你对它有一个总体的印象,但说 ...

  10. Γ函数及Γ分布,t分布,ϰ分布和费舍尔分布

    摘要 在概率统计中,有这样一类连续型分布,可以用他们来通过一组相互独立且期望,方差相同的事件来确定他们的发生的概率和数学期望.在这里我们主要介绍Γ分布以及被他们引出的χ分布,t分布和fisher分布. ...

最新文章

  1. 密码篇——对称加密—AES
  2. 初识Nginx服务器
  3. C++中的抽象类以及接口的区别联系
  4. java做 excel文件的 导入导出 (SSM+layer)
  5. MySQL 5.6 5.7最优配置文件模板
  6. 数据可视化黑科技!它比python强大20倍
  7. 10分钟学会写一个简单的Mysql存储过程
  8. 市场营销案例分析PPT模板-朴尔PPT
  9. 随着公网对讲机市场占有率得不断增长,部分对讲机厂家为了得到用户的认可,不断升级对讲机及时以及对讲机的功能和性能,因此越来越多的全国对讲机以及公网对讲机问世。但是某些用户不清楚对讲机的原理,不禁会问
  10. jxls设置隐藏列隐藏行
  11. 在线制作证件照教程,只需30秒
  12. 简单理解有监督学习、无监督学习、强化学习
  13. 如何免费搭建自己的个人网站
  14. 迭代器模式之看芒果台还是央视nie?
  15. playwright 组件超时问题
  16. 衡量机器学习算法的准确性标准
  17. 一次培训机构的面试经历
  18. 使用opencv-python制作屏幕录制工具
  19. 2020最新部编人教小学语文状元大课堂课件教案习题全套
  20. 【Matlab】input 请求用户输入

热门文章

  1. 左耳朵耗子:疫情下的远程办公,聊聊我的经验和实践
  2. halcon教程之VisionPro软件和Halcon软件 的详细对比
  3. html渲染自动保存图片,3dmax设置渲染完自动保存图片的方法
  4. 开关电源/LDO反馈电阻辅助计算工具PowerHelper使用介绍
  5. 如何把pdf转换成ezd_如何把pdf转换ppt格式
  6. 格力空调通讯协议_格力空调485通讯协议格式 485总线上modbus通信协议?
  7. TM1640调试时的异常问题
  8. H3C|HUAWEI 交换机Comware系统的基本使用(以HUAWEI S5720为例)
  9. 热敏打印机ESCPOS指令封装类,票据打印从此轻松,佳博系列实测通过
  10. blob协议的加密视频地址下载,多个ts文件合并方法,亲测有效