置信区间

先来介绍一下置信区间的预备知识:

对于正态分布而言,有3σ原则,也就是数值分布在(μ-σ,μ+σ)中的概率为0.6827;数值分布在(μ-2σ,μ+2σ)中的概率为0.9544;数值分布在(μ-3σ,μ+3σ)中的概率为0.9974。

其中μ为样本均值,σ为样本标准差。

而2σ时概率分布已经达到95%以上的水平,事件不发生的概率只有5%,可以说是极有可能发生了。所以在讨论某个情况的置信区间时通常我们都用95%。

下面具体介绍一下置信区间:

置信区间从字面上可以理解为,某一事件发生在某一个概率区间内可能的概率。这个概率被称为置信水平。举例来说,如果在一次大选中某人的支持率为55%,而置信水平0.95以上的置信区间是(50%,60%),那么他的真实支持率有百分之九十五的机率落在百分之五十和百分之六十之间,因此他的真实支持率不足一半的可能性小于百分之5。

如例子中一样,置信水平一般用百分比表示,因此置信水平0.95上的置信空间也可以表达为:95%置信区间。置信区间的两端被称为置信极限。对一个给定情形的估计来说,置信水平越高,所对应的置信区间就会越大。

我们由于有公式

SE=σn√

SE=\frac{\sigma}{\sqrt{n}}

se是样本标准差, σ\sigma 是总体标准差

所以95%的置信区间公式为:

x¯−2σn√<μB<x¯+2σn√

\bar x-\frac{2\sigma}{\sqrt{n}}
其中 μB\mu_B为要估计的数, x¯\bar x为样本均值

点估计

点估计(point estimation)是用样本统计量来估计总体参数,因为样本统计量为数轴上某一点值,估计的结果也以一个点的数值表示,所以称为点估计。

由样本数据估计总体分布所含未知参数的真值,所得到的值,称为估计值。点估计的精确程度用置信区间表示。

区间估计

区间估计顾名思义就是某事件发生在某概率区间之内可能的概率情况。比如估计一种药品所含杂质的比率在1~2%之间;估计一种合金的断裂强度在1000~1200千克之间,等等。

区间估计(interval estimation)是从点估计值和抽样标准误出发,按给定的概率值建立包含待估计参数的区间。其中这个给定的概率值称为置信度或置信水平(confidence level),这个建立起
来的包含待估计参数的区间称为置信区间(confidence interval),指总体参数值落在样本统计值某一区内的概率;

划定置信区间的两个数值分别称为置信下限(lower confidence limit,lcl)和置信上限(upper confidence limit,ucl)

样本量越大,置信区间的范围就会越小,因为样本量越大,标准误差就会越小,这样对于总成参数的估计就会越精确。

下面是区间估计的计算公式:

(x¯−z∗σn√,x¯+z∗σn√)

(\bar x-z*\frac{\sigma}{\sqrt{n}},\bar x+z*\frac{\sigma}{\sqrt{n}})
其中z为置信度,比如说95%所对应的标准正态分布的z是1.96,98%所对应的标准正态分布的z是2.33,99%所对应的标准正态分布的z是2.576
x¯\bar x是样本均值

区间估计的计算公式为什么会是这样呢?

对于区间估计,因为根据中心极限定理,抽样分布的平均值是会符合正态分布的,因此我们可以根据正态分布来求95%的置信区间。因为标准误差的定义就是抽样分布的“平均值的标准差”,因此使用中心值±\pm1.96*标准误差就可以求出平均值的置信区间。

假设检验

判断某件事是否有效果,我们称之为假设检验

距离x¯\bar x两侧的距离称之为误差界限(margin of error)

其值等于

z∗σn√

z*\frac{\sigma}{\sqrt{n}}
也就是一半的置信宽度

感觉自己这一次记得笔记要比上次好不少。最后附上我的优达学城优惠码:C7B2877A

推论统计学基础一:Estimation相关推荐

  1. Udacity课程脉络-统计学基础(一)

    前言 想了解一些机器学习基础,但对于一个零基础的人而言,只好从最基础的数据统计看起.发现优达学城的课程非常不错,为了巩固所学计划整理一下课程的脉络以及关键知识点,便于回顾. 描述统计学入门 Intro ...

  2. 统计学基础学习笔记:描述统计量

    文章目录 一.统计学基础 二.描述统计量 三.数据文件 四.绘制直方图与折线图 五.数据的位置 (一)基本概念 1.样本平均数(mean) (1)算术平均数 (2)几何平均数 2.中位数(median ...

  3. 统计学基础之数据分布

    统计学基础之数据分布 学习几种常用的数据分布 1.正态分布 正态分布(Normal distribution),也称"常态分布",又名高斯分布.正态曲线呈钟型,两头低,中间高,左右 ...

  4. 5. 统计学基础2:协方差、相关系数、协方差矩阵

    文章目录 1. 协方差 2. 相关系数[就是使 |协方差|<=1] 3. 协方差矩阵 1. 协方差 标准差和方差一般是用来描述一维数据的, 具体介绍见:5. 统计学基础1:平均值-四分位数.方差 ...

  5. NumPy 快速入门系列:应用统计学基础概念、相关统计指标与NumPy的实现

    NumPy 快速入门系列:应用统计学基础概念.相关统计指标与NumPy的实现 前言: 统计学导论: 统计学定义: 统计学分类: 统计学基本概念: 统计过程: 统计指标与NumPy: 用 Python ...

  6. 统计学基础——负二项分布的数字特征

    统计学基础--负二项分布的数字特征 一.引言 二.负二项分布定义的引出与理解 2.1 实际意义 2.2 初始定义 2.3 重新定义"负"二项分布 2.3 推导前的知识准备 三.数字 ...

  7. 【大数据人工智能】统计学入门——数据科学领域最需要了解的统计学基础概念

    目录 统计学入门--数据科学领域最需要了解的统计学基础概念 什么是统计学? 数据科学入门必备统计学概念 什么是对象? 什么是总体&

  8. 统计学基础理论学习(1)

    统计学基础知识 统计学基础知识知识点包括: 1. 数据的集中趋势 在统计学中,集中趋势又叫中央趋势,表示一个机率分布的中间值. 常见的几种表示集中趋势的计量包括算数平均数,中位数及众数. 数值平均数: ...

  9. 数据分析与数据挖掘 - 05统计概率 一 统计学基础运算

    一 统计学基础运算 1 方差的计算 在统计学中为了观察数据的离散程度,我们需要用到标准差,方差等计算.我们现在拥有以下两组数据,代表着两组同学们的成绩,现在我们要研究哪一组同学的成绩更稳定一些.方差是 ...

最新文章

  1. 2021下半年,我只想用Python搞钱!
  2. 计算机网络第四章ppt谢希仁,计算机网络课件-谢希仁(第四章).ppt
  3. matlab实现滑动平均滤波(二)
  4. python项目打包
  5. java 反转链表、合并链表
  6. NoNode for /hbase/hbaseid解决方案
  7. rest spring_Spring的REST服务发现性,第5部分
  8. 工作笔记-关于工具函数的编写问题
  9. 利用openpyxl模块来操作Excel
  10. java vim ide_把VIM配置成IDE开发环境 | 学步园
  11. xsl判断节点存在_[剑指offer]25删除链表中重复的节点
  12. 产品研发项目管理软件哪个好?
  13. 电脑右下角弹出广告和桌面自动生成游戏图标
  14. 移动应用开发学习通测试题答案
  15. 计算机运行速度靠什么,怎么让电脑运行速度变快?一招搞定
  16. 专业C语言论坛,每天C语言1-专业自动化论坛-中国工控网论坛
  17. 腾讯面试:我倒在了网络基础知识
  18. 【考题·数学】矩阵游戏(数学推导)
  19. Unix和Linux之间的区别?什么是bash?常用的linux命令
  20. 基于深度学习的无人驾驶道路检测

热门文章

  1. 在DigitalOcean玩Kubernetes(K8S)
  2. nginx通过用户和密码来实现认证功能
  3. linux 原子整数操作详解 及 volatile (二)
  4. 统一沟通-技巧-9-Lync 2010-Outlook 2010-自动配置-2-普通人员
  5. IT草根的江湖之路之六:曙光,第一次破例
  6. 中缀表达式转换成后缀表达式
  7. VB 金额大小写转换(两种方法)
  8. 谷歌系列 :Inception v1到v4
  9. Leetcode 187. 重复的DNA序列 解题思路及C++实现
  10. 微信小程序开发3——事件处理