《变量关系大揭秘㈡:性别与爱的告白》告诉我们,克莱姆相关系数的数值在0到1之间,可以用来衡量两个类别变量的相关性。今天我们来看看如何计算它(别怕,还是小学算术)。

基本原理非常非常简单,就是比较期望次数和观测次数之间的差异。

What is Expected Frequency?

期望次数

回忆之前的例子。如果“性别”与“告白方式”完全不相关,或者说,男女生喜欢的告白方式无差异,下面的六个问号应该是多少?

某个小学生会告诉你是:

也就是:

因为这种情况下,女生选择“打电话”、“发短信”、“当面说”的比例,与男生一样,都是44 : 54 : 82。上面六个问号对应的数值7、8、13、37、46、69就是期望次数。

What is Observed Frequency?

观测次数

观测次数就是之前的原始数据,《变量关系大揭秘㈡:性别与爱的告白》中的实际调查结果:

(Hi,又见面了。)

我们知道,如果观测次数与期望次数的异越大,“性别”就越影响“告白方式”,所以“性别”和“告白方式”的相关性就越强。因此,我们可以用下面的公式计算每个单元格(问号)中存在的异:

接着,我们非常希望把所有的在一起,这样就能从整体上代表“性别”和“告白方式”的相关程度。这个值越大,相关性就越强。因为上面的式子有正有负,所以我们习惯性的加上了平方,使正负不要抵消(此处可以回忆一下方差)。于是,出现了下面的公式,并且它专门有个名字叫“卡方”:

根据上面公式,本例中的卡方值是:

最后,我们来计算克莱姆相关系数吧:

关于这个公式,有几点需要说明:

  1. 分母中使用的是行数和列数中数值最小的那个。

  2. 因为要排除样本数量的影响(避免V值随着数据个数增加而变大),所以要除以样本数量,求平均意义上的观测次数与期望次数的差异。

  3. 因为之前平方,所以最后我们还要开方来“抵消”一下。

根据上面公式,本例中的V值是:

与皮尔森相关系数一样,克莱姆相关系数的大小也没有统一的标准。实际研究里面,通常需要进行检验。而这就是后话了。

讲完了。是不是很简单?

皮尔森相关系数_克莱姆相关系数的计算相关推荐

  1. 克莱姆V(克莱姆相关系数、克莱姆关联系数、独立系数)的MATLAB计算

    前些时间需要衡量多个分类数据之间两两相关程度,想找出最相关的一对分类数据:于是想到了曾经看过的克莱姆相关系数,但在网上搜了好久之后,即没发现Matlab现成的built-in函数,也没找到别人分享的M ...

  2. 克莱姆V(克莱姆相关系数、克莱姆关联系数、独立系数)

    前些时间需要衡量多个分类数据之间两两相关程度,想找出最相关的一对分类数据:于是想到了曾经看过的克莱姆相关系数,但在网上搜了好久之后,即没发现Matlab现成的built-in函数,也没找到别人分享的M ...

  3. pearson相关系数_三个相关系数的注意事项

    最近做相关性分析提高模型性能遇到不少问题,这里总结下: Correlation (Pearson, Spearman, and Kendall)​www.kaggle.com 1. Pearson c ...

  4. R计算两列数据的相关系数_数据特征分析·相关性分析

    相关性分析 相关分析是指对两个或多个具备相关性的变量元素进行分析,从而衡量两个因素的的相关密切程度,相关性的元素之间需要存在一定的联系或者概率才可以进行相关性分析. 1. 如何利用相关系数判断数据之间 ...

  5. R计算两列数据的相关系数_相关系数简介及R计算

    变量间Pearson.Spearman.Kendall.Polychoric.Tetrachoric.Polyserial.Biserial相关系数简介及R计算对于给定数据集中,变量之间的关联程度以及 ...

  6. 筛数方法相关系数_相关系数怎么计算

    展开全部 若Y=a+bX,则有: 令E(X) = μ,D(X) = σ 则E(Y) = bμ + a,D(Y) = bσ E(XY) = E(aX + bX) = aμ + b(σ + μ) Cov( ...

  7. python计算线性相关系数_Python+pandas计算数据相关系数(person、Kendall、spearman)

    pandas中DataFrame对象corr()方法的用法,该方法用来计算DataFrame对象中所有列之间的相关系数(包括pearson相关系数.Kendall Tau相关系数和spearman秩相 ...

  8. R计算两列数据的相关系数_Python+pandas计算数据相关系数(person、Kendall、spearman)...

    pandas中DataFrame对象corr()方法的用法,该方法用来计算DataFrame对象中所有列之间的相关系数(包括pearson相关系数.Kendall Tau相关系数和spearman秩相 ...

  9. 皮尔森 统计学相关性分析_pearson相关系数和spearman相关系数的区别

    展开全部 区别: 1.连续数据,正态分布,线性关系,用pearson相关系数是最恰当,当然用spearman相关系数也可以,效率没有62616964757a686964616fe78988e69d83 ...

  10. C#:实现麦克劳林级数计算非线性函数算法(附完整源码)

    C#:实现麦克劳林级数计算非线性函数算法 using System; using System.Linq;namespace Algorithms.Numeric.Series {public sta ...

最新文章

  1. 线性代数:第二章 矩阵及其运算(上)
  2. 产业丨一文读懂人工智能产业链,未来10年2000亿美元市场
  3. Java for 循环中++i和i++的区别
  4. [原创]Java中字符串、数组、集合及JSONArray的长度属性
  5. oracle biee
  6. try except python_Python的“异常”处理——try语句
  7. 孟山都公司董事长兼CEO休-格兰特出席2017年中国发展高层论坛
  8. 深度学习中的Precision和Recall,AP,mAP
  9. android 维语 字体,维语字体手机版下载-维吾尔文字体apk下载 v2.0 安卓版-IT猫扑网...
  10. U8 13.0 - 查询报表慢,程序未响应
  11. 微信朋友圈评论功能设计实现
  12. 3dmax渲染出图噪点原因及解决方法
  13. 移动APP产品经理必学的工具和必上的酷站
  14. Halcon学习---毛刺凸点检测
  15. 快递柜模拟程序【感知与控制】
  16. 虎胆龙威5java7723,汉米尔顿腕表联手《虎胆龙威5》再度演绎热血豪情
  17. DES加密解密base64转码和iphone平台一致结果
  18. caffe的Leveldb格式数据一(官方介绍)
  19. 2017CCCC天梯赛决赛 赛后总结
  20. 斗地主命令版本php,命令行版的斗地主你玩过没?

热门文章

  1. Arduino与Proteus仿真实例-74LS138译码器驱动仿真
  2. 【算法基础三】算法如何入门?零基础入门算法应该学些什么?
  3. 浏览器模式电子海图快速显示的研究
  4. 如何认识和处理ISO14001标准中“相关方”概念(转载)
  5. C# 设置图片背景色透明
  6. Windows Server AppFabric简介
  7. win7鼠标指针主题包_MouseInc 小巧好用的鼠标手势软件
  8. Cisco 路由器ntp服务配置
  9. 电脑桌面透明云便签怎么设置便签皮肤透明度?
  10. 转载子龙山人 cocos2d-x学习资源汇总(持续更新。。。)