1.点估计

在讲置信度和置信区间之前先讲讲点估计,那什么是点估计呢?给你举两个例子你就知道了。

现在你想要知道一个学校学生的身高情况,你可以把所有的学生测量一遍,然后得到答案,这种方法可以,而且得到的数据肯定是最真实的,但是这里有一个问题,什么问题呢?就是如果学生人数太多,全部测量的话工作量太大了,那怎么办呢?那就随机挑选一部分学生,然后测量这一部分学生的身高,得到一个值(一般用平均值),用这一部分的平均值来估计整体学生的身高情况,我们把这种估计方式称为点估计

现在你要看一下某流水线上 iphone 手机的不合格率,怎么看呢?最笨的方法还是把所有的手机全部开机试用,统计不合格手机的占比,这样可以吗?很明显是不可以的。那怎么才能知道这一条流水线的质量,那就是抽样,抽取整条流水线上的部分手机进行检验,会得到一个合格率,然后用这个合格率去估计整条流水线的合格率,同样这种方式也是点估计

那现在是不是大概理解点估计的意思了,就是用随机抽样的样本的计算出来的指标值去估计整体指标情况。常用的点估计方法有如下:

用样本均值估计总体均值

2.区间估计

以前上学的时候经常会考试,考完试以后老爱去估分,一般人估分不太可能直接估一个具体的数,肯定都是估一个大概的数,啥叫大概的数呢?就是比如高考分数预计 600 左右,这个左右其实就是一个区间,还有平常很多食品包装袋上会写 ±0.5 KG,表示啥意思呢?就是要么多给了你 0.5 KG,要么少给了你 0.5 KG。我们把这种用一个范围来对一个事情进行估计的方式称为区间估计,得出来的区间就是置信区间

3.置信度

你是估算出一个区间了,但是你估算的准不准呢?准确度又有多大呢?我们把这个估算的区间的准确度(可信度)称为置信度。比如说我有 95% 的把握估计我高考分数是 600-650,这里的置信区间就是 [600,650],置信度就是 95%。

一般置信度和置信区间是同向的,啥意思呢?就是置信度和置信区间一般是相同趋势。当置信度很高时,置信区间也会很大;当置信区间很大时,置信度也会很高。

比如我有 100% 的把握估计我高考分数是 0-750,这里的置信区间是 [0,750] 包含了所有分数的可能,那置信度肯定是 100% 哈。

4.如何计算置信区间

那么我们该如何通过部分样本来计算总体的一个置信区间呢?主要有下面几个步骤:

step1:首先明确要求解的问题。就是你要预估什么?不管是全校学生身高还是学生成绩。

step2:求抽样样本的平均值与标准误差(standard error)。注意标准误差与标准差(standard deviation)不一样(标准差反映了整个样本对样本平均数的离散程度,标准误差反映样本平均数对总体平均数的变异程度)。

标准差等于方差开根号。

step3:确定需要的置信水平。比如常用的 95% 的置信水平,就是我有 95% 的把握估算对,这样可以保证样本的均值会落在总体平均值2个标准差范围内。

step4:查z表,求z值。什么是z表呢?是不是已经忘记了,z表是标准正态分布表,是用来反映标准分与概率值之间的关系表,也就是通过标准分能查到概率值,通过概率值也可以反查标准分。

现在我们知道了 95% 的置信水平对应的概率值是 2.5% ,只需要通过标准正态分布表查出 2.5% 概率对应的标准分即可,也就是z值。

常用置信水平与标准分z值的对应表

置信水平 Z值
90% 1.64
95% 1.96
99% 2.58

step5:计算置信区间

a = 样本均值 - z*标准误差

b = 样本均值 + z*标准误差

最后置信区间就为 [a,b]。

5。 通过置信度查z值表!!!!

例1,置信度为95%,那么1-0.95=0.05 0.05/2=0.025 1-0.025=0.975 在表中查与0.975最相近的数值 对应的就是你要的数值 如该题就是1.96

例2,因为置信水平为95%=1-a,所以a=5%,
1-(a/2)=0.975,
再从标准正态分布图中找到0.975这个数,将这个数对应的横向数和纵向数想加,比如0.975的纵向数为1.9,横向数为0.06,所以相加得1.96

Z值表

置信度和置信区间的算法实现相关推荐

  1. 3sigma模型案例分析彻底搞懂置信度与置信区间

    学习机器学习算法时,经常会碰到数理统计中置信区间.置信度,虽然学习过相关课程,但是每次遇到它总是懵懵懂懂,似懂非懂.为了对这两个概念有深入的了解,这里做了相关的介绍.为了不老是纠缠于数理统计理论,或者 ...

  2. 数据分析师必备知识点:置信度与置信区间

    今天这篇聊聊统计学里面的置信度和置信区间,好像没怎写过统计学的东西,这篇试着写一写. 1.点估计 在讲置信度和置信区间之前先讲讲点估计,那什么是点估计呢?给你举两个例子你就知道了. 现在你想要知道一个 ...

  3. 机器学习之置信区间上界算法

    零.算法原理 一.导入标准库 In [2]: # Importing the libraries 导入库 import numpy as np import matplotlib.pyplot as ...

  4. 什么是置信度?置信区间?

    1 百度百科结解释 2 自己搜集整理 参考教程: 我们常听说的置信区间与置信度到底是什么? 置信度与置信区间的关系(附例子说明) 正态分布为何如此重要 什么是置信度?一文带你彻底浅悟置信度.置信区间. ...

  5. 机器学习的核心概念置信度和置信区间,我用这个例子把它讲明白

    点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 1 引出概念 今天,讲一个数据分析或机器学习里非常重要的概念,置信 ...

  6. 聊聊置信度与置信区间

    总第143篇/张俊红 今天这篇聊聊统计学里面的置信度和置信区间,好像没怎写过统计学的东西,这篇试着写一写. 1.点估计 在讲置信度和置信区间之前先讲讲点估计,那什么是点估计呢?给你举两个例子你就知道了 ...

  7. java求线性回归置信区间,线性回归分析详解9:总体回归、置信度、置信区间及其计算方法...

    许栩原创专栏<从入门到高手:线性回归分析详解>第9章:总体回归.置信度.置信区间及其计算方法. 多元回归方程求解后,我们分别确认了回归方程的精度和进行了回归方程的显著性验证,接下来,我们需 ...

  8. 【统计理论】关于置信度、置信区间的理解

    太长不看(简要总结) 置信区间是估测总体参数的真值,这个值只有一个,且不会变动.例如做100次实验,100个成绩,95次实验的成绩区间包含总体均值,那么就代表置信度为95%. 随着置信度的上升,置信区 ...

  9. 置信度,置信区间,区间估计

    参考:http://blog.sina.com.cn/s/blog_7dc56e6e0100r187.html 置信区间(间距)是指,在某一置信度下,总体参数所在区域的长度. 置信度(置信水平)是也称 ...

最新文章

  1. asp.net 获取当前时间的格式
  2. R语言dplyr包移除dataframe数据行实战(Remove Rows):按照条件移除数据行、按照索引移除数据行、删除包含NA值的所有数据行、删除具体列包含NA值的数据行
  3. tf.arg_max
  4. 全面理解SSD和NAND Flash
  5. oracle大表如何快速删除一列,Oracle 对表中的记录进行大批量删除
  6. iOS开发(7)通过uiimageView浅谈UIView
  7. 直流耦合and交流耦合
  8. 修改innodb_flush_log_at_trx_commit参数提升insert性能
  9. pythonc代码_Python实现C代码统计工具(一)
  10. 只能发邮件不能接受_《GTA5》R星发邮件问候玩家会发生什么?以下操作一个也别碰...
  11. U-Boot的常用命令详解
  12. CF651A Joysticks
  13. JQuery文档分析1-JQuery核心与选择器
  14. Struts2项目实战 微云盘(七):文件上传下载
  15. thoughtworks作业trains
  16. atom-beautify sqlparse中文乱码|Could not find ‘sqlFormat‘ Beautify 0.28.7
  17. 我是如何从通信转到Java软件开发工程师的?
  18. 家用宽带优化-光猫桥接,路由器拨号
  19. 解决:浏览器下载的Excel文件显示“文件已损坏,无法打开”
  20. 每次开机总要打开很多软件

热门文章

  1. HTML+CSS入门
  2. rtthread studio与正点原子apollo(3)--硬件定时器HTIMER
  3. DPDK系列之二DPDK编译
  4. 开放的生态见证企业的伟大
  5. Cocos2D实现Fruit Ninja里面刀光效果教程
  6. HTML5期末大作业:个人空间网站设计——个人主页介绍(6页) HTML+CSS+JavaScript web课程设计网页规划与设计 web学生网页设计作业源码 学生DW网页设计作业成品
  7. iOS 开发实战培训
  8. AMD冲出Intel森林
  9. Google受隐私问题困扰 或放弃欧洲版街景服务
  10. 文爱计算机电子琴,xx年下半年幼儿教师个人工作计划范文.doc