分布通过检验统计量来比较期望结果和实际结果之间的差别,然后得出观察结果发生的概率。其中O代表观察值,E代表期望值。这个检验统计量提供了一种期望值与观察值之间差异的度量办法。最后反映在数值的大小上。

那么,当大到什么程度,差异才算显著呢?这要根据自由度,设定的显著性水平查找分布表来判定。对于卡方分布的具体使用,我认为其有三要素:一个公式,一张分布表,一张概率密度图。下左图中n代表自由度,纵轴为概率值,横轴为卡方值。自由度越大,卡方分布的外形越接近正态分布。下右表即为卡方分布表,第一列为自由度,第一行为显著水平,据此可以查找到临界值,如果检验统计量大于临界值,则检验统计量就位于拒绝域以内,说明观察结果与期望结果之间的差异显著。

分布有两个主要用途:

(1)用于检验拟合优度,也就是可以检验一组数据与指定曲线的拟合程度,或检验某组观察值是否符合某种分布。

(2)检验两个变量的独立性,通过这个方法检查两个变量之间是否存在某种关联

对于拟合优度检验,主要是找到期望值与观察值,带入公式计算卡方值,然后查表即可得出结论。举例说明:

本人开发了一台体重秤,我想通过与标准体重秤对比,看看我开发的体重秤在精度上是否能够和标准设备相媲美,是否与标准设备存在显著差异,于是我找来5个人,我知道他们总体重值为300kg,所以我只需要知道4个人的体重,就可以知道第五个人的体重,因此,确定了自由度为4,然后设定了显著性水平=0.05。对于每一个人,各用我开发的体重秤和标准体重秤称量一次,我就获得了每个人的期望值(标准称量结果)与我的观察值(我开发的体重秤称量结果),然后带入卡方公式求得卡方值,与查表所得临界值进行比较,如果大于临界值,说明差异显著。

对于变量独立性检验,与拟合优度检验的差别在于需要通过观察值算出期望值,这要依靠概率。。。 首先要为两个变量构建列联表,假设我们要检验一场赌局的结果是否与庄家有关系,观察结果如下:

观察值 庄家A 庄家B 庄家C 合计
43 49 22 114
8 2 5 15
47 44 30 121
合计 98 95 57 250

据此依靠概率建立期望值,我们假设庄家和是否赢局无关,则依据此假设建立起来的A坐庄且赢的概率=A坐庄率X赢局率

A坐庄率=98/250

赢局率  =114/250

于是与A坐庄且赢的观察值所对应的期望值为250XA坐庄率X赢局率

以此类推,可求得其他期望值。

期望值 庄家A 庄家B 庄家C
44.688 43.32 25.992
5.88 5.7 3.42
47.432 45.98 27.588

自由度是在考虑限制条件的情况下,可以自由选择的独立信息的数目。鉴于我们知道每一行和每一列的总和,因此,只需知道表中红色部分的内容即可,因此自由度为4.

当卡方结果大于临界值,说明观察值和期望值有差别,由于我们的假设认为是否赢局和庄家没有关系,基于此假设,计算得到期望值,可实际观察值和期望值却有明显差别,则说明两个变量不独立,反之,如果卡方结果小于临界值,则独立。

就是因为我们在假设两个变量相互独立的情况下得到的期望值,如果观察值与期望值无显著差别,说明观察值符合我们的假设。

卡方分布Chi-squared Distribution相关推荐

  1. R语言卡方分布函数Binomial Distribution(dchisq, pchisq, qchisq rchisq)实战

    R语言卡方分布函数Binomial Distribution(dchisq, pchisq, qchisq & rchisq)实战 目录 R语言卡方分布函数Binomial Distribut ...

  2. 卡方分布(Chi-Squared Distribution)

    定义 通俗的说就是通过小数量的样本容量去预估总体容量的分布情况 卡方检验就是统计样本的实际观测值与理论推断值之间的偏离程度 若n个相互独立的随机变量ξ₁,ξ₂,...,ξn ,均服从标准正态分布(也称 ...

  3. 假设检验——T-test, F-test, Z-test ,Chi squared test

    T-test 用来比较两样本平均值之间是否具有显著性差异. T-test类型: one-sample t-test,用来比较单个样本平均值和一个给定的平均值(理论值): independent sam ...

  4. 卡方分布(Chi-square Distribution,Chi2)

    1.定义 若n个相互独立的随机变量ξ₁,ξ₂,...,ξn ,均服从标准正态分布(也称独立同分布于标准正态分布),则这n个服从标准正态分布的随机变量的平方和构成一新的随机变量,其分布规律称为卡方分布. ...

  5. 卡方分布(Chi-squared Distribution)与卡方检验(Chi-square Test)

    卡方分布 概念: 具有k个自由度的卡方分布是一个由k个独立标准正态随机变量的和所构成的分布.卡方分布经常用于我们常见的卡方检验中.卡方检验一方面可以用来衡量观测分布和理论分布之间的拟合程度,另一方面也 ...

  6. 卡方分布(Chi-Square Distribution)

    1.卡方分布 在统计学中, 很多假设检验的检验统计量在原假设下服从卡方分布. 这种检验统计量服从卡方分布的假设检验适用于分类数据. Γ(v2)\Gamma(\frac{v}{2})Γ(2v​)为伽马函 ...

  7. 显著性检验python

    Table of Contents 1  信用特征检验/模型稳健性检验的代码实现 1.1  常用的检验实现 1.1.1  ttest_ind 1.1.2  曼-惠特尼U检验(Mann-Whitney ...

  8. C++ 中使用伪随机数

    C++ 中使用伪随机数 使用过 C语言标准库中随机数相关功能的同学肯定还记得 C 库中提供的两个函数: rand() srand() 为了使用这两个函数,需要包含头文件 stdlib.h.这么多年来C ...

  9. 史上最简SLAM零基础解读(6) - 卡方分布(chi-square distribution)和()卡方检验(Chi-Squared Test) → 理论讲解与推导

    本人讲解关于slam一系列文章汇总链接:史上最全slam从零开始   文末正下方中心提供了本人联系方式,点击本人照片即可显示WX→官方认证{\color{blue}{文末正下方中心}提供了本人 \co ...

  10. 统计学知识梳理(四)线性回归、卡方分布与方差分析

    一.线性回归中的R方误差 假设: 预测值:y^={y^1,y^2,-,y^n}\hat{\mathbf{y}}=\left\{\hat{y}_{1}, \hat{y}_{2}, \dots, \hat ...

最新文章

  1. 初学Python常见异常错误,总有一处你会遇到!
  2. BeanUtils API中使用ConvertUtils向BeanUtils注册一个日期转换器
  3. cac会议投稿难度大吗_成考高升专难度大吗?考试通过率怎么样?
  4. Python中的高阶函数filter
  5. 悔不当初:回顾进化之路
  6. 多线程中的互斥控制程序代码_Java中的并发——线程安全性
  7. Unity Application Block 3月12 发布的版本
  8. 我是如何旅游 5 个月拿到 3 份 Offer 并收入翻倍的
  9. 和显卡驱动要配套吗_显卡有必要更新驱动程序吗?老玩家的建议请收好
  10. 简单高效的短链接生成服务C#实现
  11. OpenGL编程指南学习 之一 源码环境运行
  12. lg v35 thinkq刷韩版android9.0教程
  13. 通信原理 | 信道容量
  14. 一文看懂网卡驱动原理及移植方法
  15. RFID射频识别的解读及应用
  16. 用GO语言编写一个简单的区块链
  17. Flashback 简介
  18. 语音生成视频论文:Audio-driven Talking Face Video Generation with Learning-based Personalized Head Pose
  19. 520送男友的纪念礼物,最适合跑步/运动的蓝牙耳机推荐
  20. 黑苹果:仅适用ASUS Z390-H主板(败家之眼)

热门文章

  1. Excel表格中如何快速跨表复制粘贴,将表1数据一键复制到表2、表3、表4
  2. JAVA毕业设计进出货管理系统计算机源码+lw文档+系统+调试部署+数据库
  3. led数码显示控制plc实验_实验三LED数码显示控制PLC实验报告.doc
  4. CSDN【精品专栏】第22期
  5. FX3U PLC源代码,stm32芯片。 全套硬件,软件源码,可以直接用GX Works2编程直接写入
  6. STM32F103ZET6 ATK1218-BD精简版例程
  7. 医学统计学题库带答案
  8. 华为数通笔记-BGP环路、次优问题、黑洞路由
  9. Siemens-PLM-TeamCenter虚拟机安装与配置
  10. Eye-in-hand和Eye-to-hand问题求解和实验