Somers’ Delta (Somers’ D) 是对有序变量对之间一致性的度量。

在统计学中,**Somers’D**有时被错误地称为 Somer’D,它是对两个可能相关的随机变量X和Y之间的序数关联的度量。Somers 'D等于-1时,表示 所有变量对都不一致。Somers 'D等于1时表示所有变量对都一致时。Somers 'D以 Robert H. Somers 的名字命名,他于 1962 年提出了它。

序数变量是有序的,例如从最好到最坏或从最小到最大(李克特量表(Likert scale )是比较流行的序数量表之一。)

一致性度量告诉您两对变量是如何连接的。这种连通性是由一致性和不一致定义的。简而言之,一致对“匹配”而不一致对不匹配。

Delta 可以从列联表中的行类别预测列类别。更具体地说,不对称* Somers’ D 测量因变量的预测改进的程度,基于了解自变量的值。因此,在运行此测试时定义哪个变量是自变量以及哪个变量是因变量非常重要:您将获得 (X,Y) 和 (Y,X) 的两个不同结果。举一个简单的例子,假设您想知道客户满意度(1 到 5 的等级)是否取决于您的销售人员的友好程度(1 到 3 的等级)。如果您切换自变量和因变量,您将衡量客户满意度对销售人员的友好程度的影响。这可能是有趣的信息,但这不是您感兴趣的关系。

解释

Delta 是Pearson 相关系数的序数替代。与 Pearson 的 R 一样,Somers 'D 的范围是 -1 到 1:

-1 = 所有变量都不一致

1 = 所有对都一致

**Somers’ D 的大值(趋向于 -1 或 1)表明该模型具有良好的预测能力。较小的值(在任一方向上趋于零)表明该模型是一个较差的预测器。**假设您在友好的销售人员/客户满意度场景中的 Delta 为 0.549。客户满意度是因变量,因此可以说友好的销售人员将客户满意度提高了 54.9%。

Somers 'D 随着列联表维度的增加而增加,但确实倾向于低估表中的实际关联程度(Göktaş & İşçi,2011)。

正式定义

Somers ’ D 有多种定义。一种方法是“一致对的数量与不一致对的数量之差除以与自变量无关的对的总数”(牛津指数)。这个定义让您了解计算的复杂程度;找到一致/不一致的对不是一项快速的任务。此外,Delta 的具体公式取决于自变量的位置(Göktaş & İşçi,2011)。这就是通常使用软件来查找 Delta 的原因之一。

Somers ’ D 有时也用Kendall 的 Tau定义:

D(Y |X) = τ (X,Y)/ τ (X,X)

在哪里:

  • (X,Y) 是一对二元随机变量。

  • τ 是 Kendall 的 Tau。

或者,如果一个 X 大于另一个,则可以将其定义为两个对应条件概率之间的差值。Delta 和 Tau-b 之间的区别仅在于 Delta 校正了自变量上的并列对:

Somers’ D 与 Gamma

Somers 'D 和 Goodman 以及Kruskal 的 gamma 都可以找到两个有序变量之间的关联。与 Goodman 和 Kruskal 的 gamma 不同,Somers 'D 区分自变量和因变量。两者之间的区别可能是模糊的,但如果您知道您的数据和分析的目标(即,如果将一个变量标记为相关变量很重要),则应该清楚使用这两个过程中的哪一个。

存在两个版本的 Delta:不对称和对称。非对称版本是迄今为止最受欢迎的版本,也是您在使用软件(例如SPSS)时可能会遇到的版本。当您阅读“Somers’ D”时,您可能正在阅读非对称版本(尽管很多作者并未阐明这一点)。对称版本——其中两个变量都被忽略为独立或相关——确实存在,因此在解释结果之前澄清你使用的是哪个是明智的。

Somers’ D计算举例

假设独立(预测变量)变量X取三个值,0.25 ,0.5 , 或0.75,独立(结果)变量Y取两个值,0或1 . 下表包含观察到的X和Y组合:

( Y , X对的 频率)

因此, Somers '_D_等于

按照之前定义,Somers’ D 的大值(趋向于 -1 或 1)表明该模型具有良好的预测能力。较小的值(在任一方向上趋于零)表明该模型是一个较差的预测器。该Somers 'D等于0.34,表示模型预测能力较差。

版权声明:文章来自公众号(python风控模型),未经许可,不得抄袭。遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。

欢迎学习csdn学院更多金融风控相关知识《python金融风控评分卡模型和数据分析》

Somer’s D(Somers’ Delta)-顺序变量相关性分析方法相关推荐

  1. python基于pingouin包进行统计分析:使用partial_corr函数执行两个变量之间的偏相关性检验、covar参数指定对应的协变量(多个)、method参数指定相关性分析方法

    python基于pingouin包进行统计分析:使用partial_corr函数执行两个变量之间的偏相关性检验.covar参数指定对应的协变量(多个).method参数指定相关性分析方法.altern ...

  2. 相关性分析方法(Pearson、Spearman)

    有时候我们根据需要要研究数据集中某些属性和指定属性的相关性,显然我们可以使用一般的统计学方法解决这个问题,下面简单介绍两种相关性分析方法,不细说具体的方法的过程和原理,只是简单的做个介绍,由于理解可能 ...

  3. SPSS常用的相关性分析方法解析(转载)

    相关性分析旨在分析两组数据之间是否相互影响,彼此是否独立的变动.SPSS内部提供了多种分析数据相关性的方法:卡方检验(Chi-SquareTest),Pearson相关系数计算,Spearman相关系 ...

  4. 分类变量、有序变量与数值变量相关性分析方法总结及 R 语言应用

    文章目录 一.分类 & 分类·相关性分析 二.有序 & 有序·相关性分析 三.数值 & 数值·相关性分析 四.分类 & 有序·相关性分析 五.分类 & 数值·相 ...

  5. 如何选择相关性分析方法

    关注"心仪脑"查看更多脑科学知识的分享. 我们说研究变量之间的关系主要有两种,一种是函数关系,一种是相关关系. 相关性分析主要用于:(1)判断两个或多个变量之间的统计学关联:(2) ...

  6. 神经网络相关性分析方法,神经网络相关性分析图

    1.bp神经网络怎么确定输入与输出是正相关还是负相关? 想了解输入输出关系你可以求协方差,进而求peason相关系数 当然你也可以求spearman 等,看他们的相关度即可,正负就代表是正相关还是负相 ...

  7. excel两个指标相关性分析_用Excel做相关性分析方法

    2006-11-15 05:24 分享到: 我要吐槽 化学合成实验中经常需要考察压力随温度的变化情况. 某次实验在两个不同的反应器中 进行同一条件下实验得到两组温度与压力相关数据, 试分析它们与温度的 ...

  8. 统计数据类型与对应的相关性分析方法

    在统计学中,统计数据主要可分为四种类型,分别是定类数据,定序数据,定距数据,定比变量. 1.定类数据(Nominal):名义级数据,数据的最低级,表示个体在属性上的特征或类别上的不同变量,仅仅是一种标 ...

  9. python相关性分析模型,相关性分析原理及Python实战

    本文阅读时间大概在8分钟. 相关性分析 我们常说的相关性分析是分析两个变量之间线性相关程度的方法,其相关性强度的度量即为相关性系数.现实中很多事物间都拥有或多或少的相关性,例如,房屋面积对价格的影响, ...

  10. 相关性分析和热图绘制

    一.什么是相关性分析? 相关性分析是指对两个或多个具备相关性的变量元素进行分析,从而衡量两个变量因素的相关密切程度.相关性的元素之间需要存在一定的联系或者概率才可以进行相关性分析.在组学测序(如转录组 ...

最新文章

  1. xml操作类(转载)
  2. DARPA 2020财年研发预算 人工智能应用研究投资急剧增长
  3. 清华集训2014 day2 task1 简单回路
  4. 音频处理六:(音频的反FFT)
  5. 基于MaxCompute的数仓数据质量管理
  6. Linux源代码组织架构
  7. python 生成器 generator
  8. 国内外常用计算机杀毒软件,国外杀毒软件排行榜(国内的不要)
  9. 0ctf-2016 pwn-warmup writeup
  10. 开发工具-vscode 使用技巧
  11. nginx学习十 ngx_cycle_t 、ngx_connection_t 和ngx_listening_t
  12. .net Application.DoEvents()
  13. 远程控制软件开发_软件开发人员的远程工作
  14. 02 数字图像技术——颜色空间转换与颜色空间分割实验结果与分析——python
  15. 7⽂件查找和压缩问题和练习
  16. (转)造势满分的摩羯智投都存在哪些问题?
  17. linux的echo连接字符串输出,echo命令 – 输出字符串或提取She
  18. E-mail Marketing 的特点及其利弊
  19. python正则将qq聊天记录转换为html
  20. ueditor编辑器复制粘贴图片上传

热门文章

  1. 应届生web前端面试题_Web前端初学者(应届生)面试攻略
  2. 轨迹绕圈算法_算法程序解决如下问题:质点在平面坐标系中运动,每次x或者y坐标增加或减少1,如何判断质点是否顺时针质点的轨迹我们是知道的,当我们已经知道质点在绕圈运动了,那么怎么判断它是在顺时...
  3. Spring-IOC本质
  4. Keil5二步解决中文乱码,注释乱码问题
  5. 关于网页编码的故事,你都清楚嘛?utf与gbk的关系
  6. 16进制转浮点型_浮点型变量和BigDecimal的使用
  7. 理解 __doPostBack--1
  8. 飘刃 0.1.1 发布,速度碾压 Vue-CLI 的轻量级 Vue 项目构建工具
  9. 解决windows 下 mysql命令行导入备份文件 查询时乱码的问题
  10. 《Java技术》预备作业总结