鄙人学习笔记


文章目录

  • 分类数据分析
    • 分类数据与卡方统计量
    • 拟合优度检验
    • 独立性检验
    • 列联表中的相关测量
    • 列联分析中应注意的问题

分类数据分析

分类数据与卡方统计量

卡方检验是对分类数据的频数进行分析的统计方法。

  • 卡方统计量

卡方统计量可以用于测定两个分类变量之间的相关程度。若用fo表示观察值频数,用fe表示期望值频数,则卡方统计量可以写为:

  • 卡方统计量的特征

拟合优度检验

拟合优度检验是用卡方统计量进行统计显著性检验的重要内容之一。
它是依据总体分布状况,计算出分类变量中各类别的期望频数,与分布的观察频数进行对比,判断期望频数与观察频数是否有显著差异,从而达到对分类变量进行分析的目的。

独立性检验

  • 列联表
    列联表是由两个以上的变量进行交叉分类的频数分布表。

  • 独立性检验

独立性检验就是分析列联表中行变量和列变量是否相互独立。

列联表中的相关测量

  • φ相关系数

φ相关系数描述2X2列联表数据相关程度最常用的一种相关系数。它的计算公式为:

对于2X2列联表中的数据,计算出的φ相关系数可以控制在0~1这个范围,但是当行数R或列数C大于2时,φ相关系数会随着行数R或列数C变大而增大,且φ系数无上限。

  • 列联相关系数

列联相关系数又称列联系数,简称c系数,主要用于大于2X2列联表的情况,c系数的计算公式为:

当列联表中的两个变量相互独立时,c系数=0,但它不可能大于1,
c系数的特点是,其可能的最大值依赖于列联表的行数和列数,且随着R和C的增大而增大。

  • V相关系数

鉴于φ相关系数无上限,c系数小于1的情况。克莱默提出了V相关系数,V相关系数的计算公式为:

当两个变量相互独立时,V=0;当两个变量完全相关时,V=1。所以V的取值在0一1之间,如果列联表中有一维为2,则V值就等于φ值。

对于同一个数据,系数φ、c、V的结果不同。同样,对于不
同的列联表,行数和列数的差异也会影响系数值。因此。在对不同列联表变量之间的相关程度进行比较时。不同列联表中行与行、列与列的个数要相同.并且采用同一种系数,这样的系数值才具有可比性。

列联分析中应注意的问题

  • 卡方分布的期望准则

前面谈到的用卡方分布进行独立性检验,要求样本量必须足够大,特别是每个单元中的期望频数(理论频数)不能过小,否则应用卡方检验可能会得出错误的结论。

一条准则是:
如果只有两个单元,每个单元的期望频数必须是5或5以上。

另一条准则是:
倘若有两个以上的单元,如果20%的单元期望频数fef_efe​小于5,则不能应用卡方检验。

不满足准则时的解决方法:
将fef_efe​较小的类别合并,使得合并后的类别的fe≥5f_e ≥ 5fe​≥5

《统计学》学习笔记之分类数据分析相关推荐

  1. HALCON 20.11:深度学习笔记(10)---分类

    HALCON 20.11:深度学习笔记(10)---分类 HALCON 20.11.0.0中,实现了深度学习方法. 本章解释了如何在训练和推理阶段使用基于深度学习的分类. 基于深度学习的分类是一种对一 ...

  2. R语言与机器学习学习笔记(分类算法)

    转载自:http://www.itongji.cn/article/0P534092014.html 人工神经网络(ANN),简称神经网络,是一种模仿生物神经网络的结构和功能的数学模型或计算模型.神经 ...

  3. 数据分析知识——统计学学习笔记(拉勾数据分析训练营)

    模块1 统计学基本概念 1 测量尺度 人文社科中的分类尺度 1定类尺度 功能:分类作用,比如性别.英文:Norminal 2定序尺度 功能:分类.排序作用,比如喜欢的艺人.年级.英文:Ordinal ...

  4. Python学习笔记(五.数据分析 ——上)

    系列文章持续更新中- 文章目录 前言 一.相关性分析 A.获取股票价格 a.获取日K线的股票价格 b.获取每分钟的股票价格 B. 合并股票价格 C.股票价格相关性分析 二.假设检验 三.方差分析 A. ...

  5. 【学习笔记】python数据分析-Pandas

    目录 pandas数据结构 创建Series数据 创建DataFrame数据 pandas的索引操作 重新索引 更换索引 索引选取 选取行 选取列 布尔选择 pandas的增删改 增加行或列 删除行或 ...

  6. 小牛的学习笔记--乳腺癌症数据分析

    二分类:损失函数精确度的图像:加深模型 一.深度学习五步骤 加载数据集 定义模型 编译模型 训练模型(fit) 评估模型 二.这里以乳腺癌症数据分析为例 这里没有分开训练集和测试集 导入包 from ...

  7. 『paddle』paddleclas 学习笔记:分类预训练模型选择

    目录 ImageNet预训练模型库 模型库概览图 SSLD知识蒸馏预训练模型 ResNet 及其 Vd 系列 移动端系列 SEResNeXt与Res2Net系列 DPN 与 DenseNet 系列 H ...

  8. 【学习笔记】商业数据分析

    商业数据分析 商业数据分析是指以数据和商业理论为基础,通过寻找数据规律,结合业务背景,依靠统计软件和可视化工具,以优化企业经营决策为目的,洞察经营数据背后的规律等,从而为企业提供生产力和业务效益,其中 ...

  9. Pytorch(1) 学习笔记-多分类网络的搭建

    接触机器学习和深度学习已经有一段时间了,一直想做个记录,方便自己以后的查阅. 一开始我搭建神经网络时所使用的框架是Tensorflow,虽然功能强大但是不同版本代码的兼容性有些差强人意. 以下的内容所 ...

最新文章

  1. 关于C#内存释放的BUG?
  2. SpringBoot单元测试运行时报错:Failed to load ApplicationContext
  3. Arquillian变色龙。 简化您的Arquillian测试
  4. windows下揪出java程序占用cpu很高的线程
  5. mysql offset函数_mysql查询语句解析
  6. Vue 监视属性 watch
  7. Element ui select同时获取value和label的值
  8. 七种Spring事务传播特性
  9. 使用Dependency Walker对模块进行故障排除
  10. MATLAB视频转图片保存
  11. NCTF-Writeup
  12. c语言程序设计张新成课后习题答案,C语言练习题2
  13. [USACO 2009 Dec G]Video Game Troubles-----分组背包的改良版
  14. 华为AirEngine 5762S-11面板AP配置
  15. 绝对位置运动指令(MoveAbsJ)
  16. 用Xbee实现Arduino之间的无线通信,远程控制小灯
  17. 有哪些布局精心、长久的骗局?
  18. 麦当劳宣布20年来最大规模收购 提高服务智能化
  19. 1恢复 群晖raid_【官方】群晖官方数据恢复方法
  20. HTML5期末大作业 基于HTML+CSS+JavaScript学校官网首页

热门文章

  1. mysql主主备份_MySQL主从备份和主主备份配置+Keepalived+MySQL读写分离
  2. xsd文件转图片_如何将图片转化为PDF格式?分享一个超简单的方法给你
  3. java 开源 网络流量统计_jpcap java流量监控
  4. iview地区加载_LoadingBar 加载进度条
  5. vi/vim的基本使用方法
  6. passwd命令提示: 鉴定令牌操作错误
  7. 目录和文件管理(一)
  8. inotify+rsync
  9. ie8一下解决圆角,阴影不兼容问题
  10. C# 重绘tabControl,添加关闭按钮(续)