这可能是一篇会引起很多争议的文章,在写完初稿后搁置了大半年的时间,现在略作修改分两次发完,希望能够引起大家的讨论。

熟悉我的人都知道,在MSA中,我明确反对两个东西。

一个是ndc,因为这只是%P/Tv的另一个解释,但却派生出独立的判断标准,使得两个指标之间产生了矛盾,使人无所适从。在《六西格玛管理统计指南》第3版(以下简称指南三)p.405-407有详细阐述,在此不再赘述。

另一个就是属性数据MSA中的Kappa。

一致率、误判率、漏判率这些简单明了的指标足以让我们对测量系统做出恰当的判断,为什么还要画蛇添足地加上一个Kappa呢?很多年来我从来不讲Kappa,在蓝皮书里也只是简单提了一下,并没有做详细的阐述。但这也没有什么用,Kappa分析仍大行其道,又像ndc一样,成为了一种教条。

虽然明确反对使用Kappa分析,但说实话,我自己也信心不足,毕竟对此没有多深入的了解。为此我做了一些功课,也有了一些心得。在此提出来与各位探讨,欢迎拍砖。

我们先看看针对属性数据的一致性标准。

这样的标准表述比较清晰,很容易理解,也比较容易得出结论。

再看看Kappa的标准,大于0.9可接受,介于0.7~0.9可勉强接受,小于0.7不合格。但0.7或0.9的实际意义是什么,与一致性有什么关系,却没有说清楚。在实际应用中,当Kappa的结论与一致性的结论矛盾时,往往让人无所适从。如下面这个案例:

从分析结果上中,评估一致性以及与标准的一致性均只有76%,但Kappa值却有0.75和0.87。根据上述标准判断,一个是不合格,一个是可以让步接受,那应该怎么下结论呢?如果判定不合格,但Kappa却显示可以用,尤其是后一个,都接近0.9了;如果判定可接受,但明明一致性不好啊。

类似的不协调也出现在%P/Tv和ndc之间,这里不再赘述。

为什么会出现这种结果呢?本文试图从Kappa分析的原理来做一探究。

Kappa分析有两种。

一种是Cohen's Kappa,只能用于分析对同一组对象两次评价的一致性,如一个人先后两次评价的一致性、一次评价与标准的一致性、两个人对同一组对象评价的一致性等。具体原理参见拙作《列联表篇之二:四格表的分析》。

另一种就是大家熟悉的Fleiss' Kappa,可以用于对同一组对象的多次评价的一致性分析,目前流行的属性数据MSA就是采用这种分析。具体原理参见拙作《列联表篇之十:属性相同双向有序表的Kappa分析》。

首先用Cohen's Kappa做一个热身。

在四川大学王军2006年的硕士论文《Kappa系数在一致性评价中的应用研究》中,总结了三种反例。其中之一如下例:

这个案例中,一致率达到了0.704,但算出的Kappa值却只有0.006,这明显不符合常理。更进一步看下一个例子:

这两个案例的一致率都是0.8,但Kappa值却相差很多。

问题出在四格表中左上角a和右下角d取值不平衡上。可以想见,a和d相差越大,Kappa值越小。

我们可以做一个模拟,来看看Kappa值是如果随a、d的取值变化的。

为了方便使用Cohen'sKappa,假设在属性一致性分析时,选择了50个样品,由一个人重复测量2次。构建的四格表如下:

为了分析方便,我们固定取b和c为1,这样可以计算出一致率P0为0.96,这应该是很高的一致率了。a取值从24逐渐减到0,同时d从24逐渐加到48,我们可以看看Kappa值呈现怎样的变化。

可以看出,当a减少到13时,Kappa值降低到0.9以下,当a继续减少时,Kappa值会快速下降,这时就会出现判据不一致的问题。

如果将一致率降低到0.9,则Kappa的变化曲线是这样的。

此时Kappa最大只有0.8,也就是说,即使一致率达到了90%,因为Kappa均在0.8以下,因此也不能得出测量系统合格的结论,又产生了判断不一致的情况。

由上面的初步分析可以看出,Kappa值的大小依赖于样本的结构。如果MSA样本中合格与不合格品数量差异很大,则会得到小的Kappa值。如果你想得到比较Kappa值与一致率大致相当的结论,建议尽可能保持合格/不合格样本量的平衡。

在不了解样本结构时直接根据Kappa下结论是危险的。即使Kappa值为1,如果样本全部是非常容易判断的产品组成的,那么这个结论也是值得怀疑的。反过来说,即使Kappa值不高,但样本构成中包含大量难判断的产品,结论也不是不可接受,需要进一步分析检验员判断错误的实际情况后作出恰当的结论。

来源:张老师漫谈六西格玛

matlab kappa风险分析,我为什么反对在属性数据MSA中用Kappa分析(上) | 汽车质量管理笔记...相关推荐

  1. 201632位matlab下载_【科研利器】带你get“研”途上的MATLAB入门篇

    经过半个多月的激烈角逐,在同学们的热情投票和支持下,MATLAB以超过半数的选票成功成为同学们心目中最想get的app.在接下来的学习中,我们将教程一共分为两期.入门篇.提高篇.首先是基础入门篇.敲黑 ...

  2. 用MATLAB app designer设计人机交互界面——二阶线性动态电路可视化分析的研究

    用MATLAB app designer设计人机交互界面--二阶线性动态电路可视化分析的研究 这是我第一次尝试写博客,我试着给出电路课上要求的电路实验编程.但是电路的类型有点儿多,所以我只以二阶动态电 ...

  3. 汽车理论学习笔记(一)- 汽车动力性 - Matlab及Simulink仿真

    前言:由于后续要从事汽车行业,所以这段时间对<汽车理论>这本书进行了系统的学习,并利用Matlab.Simulink对汽车的动力性.操纵稳定性.平顺性等进行了仿真,加深了对汽车理论的理解. ...

  4. 扩展城市信道etu模型matlab仿真,LTE System Toolbox:无线通信系统的仿真、分析和测试...

    LTE System Toolbox 提供用于设计.仿真和验证 LTE 和 LTE-Advanced 通信系统且符合标准的函数和应用程序.该系统工具箱加速了 LTE 算法和物理层 (PHY) 部署,支 ...

  5. 【 MATLAB 】模拟信号采样及离散时间傅里叶变换(DTFT)案例分析

    这篇博文中使用的模拟信号为上篇博文:[ MATLAB ]使用 MATLAB 实现模拟信号的近似及其连续傅里叶变换 中使用的模拟信号: 为了研究在频域数量上的采样效果,对该信号使用两种不同的采样频率采样 ...

  6. 【 MATLAB 】用 MATLAB 实现离散时间傅里叶变换(DTFT)的两个案例分析

    先给出离散时间傅里叶变换的简单介绍: 如果 x(n) 是绝对可加的,即 那么它的离散时间傅里叶变换给出为: w 称为数字频率,单位是每样本 rad(弧度)或 (弧度/样本)(rad/sample) 案 ...

  7. 用matlab分析时间响应教程,基于Matlab的多自由度耦合滑移模型的动力响应可靠度分析...

    Hi~我是mania 参考资料: (1)基于耦合滑移模型的岩体地震可靠性分析方法 (3)结构可靠度分析:方法与程序 简化模型及运动平衡方程 如下图1所示的多层隔震建筑,当受到地震作用时每层结构体都会产 ...

  8. 【MATLAB教程案例2】GPS信号捕获算法的案例分析

    FPGA教程目录 MATLAB教程目录 -------------------------------------------------------------------------------- ...

  9. matlab 直方图_MATLAB作图实例:19:用二元直方图分析图片颜色

    本示例说明如何调整二元直方图的颜色标度(color scale),以显示有关分箱(bin)的其他详细信息. 加载图像peppers.png,该图像是几种类型的辣椒和其他蔬菜的彩色照片.无符号的8位整数 ...

  10. python中np.reshape与matlab中reshape区别,以及多axis的np.mean分析[探索6]

    1.np.reshape与matlab中reshape区别 np.reshape是按行重组的,而matlab是按列重组的. 2.多axis的np.mean分析 np.mean(A,0)与matlab中 ...

最新文章

  1. 神经网络的反向传播(BP)是什么?sigmoid函数的导数是什么,有什么形式优势、优缺点?
  2. SUN 论坛http://forums.sun.com/forum.jspa?forumID=840
  3. 院士谈如何做好研究生:要逼着自己去想问题,最大的浪费是聪明人不思考
  4. CentOS 6.3开机自动挂载磁盘和文件夹
  5. hc05与单片机连接图_基于proteus的51单片机开发实例(13)-LED指示那个按键被按下
  6. 未启用当前数据库的 SQL Server Service Broker
  7. 搭建一个redis高可用系统
  8. python完全支持面向对象编程思想_面向对象的编程思想和Python的继承和多态,特殊方法,引用计数...
  9. Control-Flow Enforcement Technology (CET)
  10. javascript js 拖动效果 兼 ie 6,7,8 firefox Chrome(原创,想要尽管拿去用。技术支持:QQ3084532)...
  11. 09基于对象编程风格
  12. 用Prime95来做linux下CPU压力测试
  13. jQuery实现倒计时重新发送短信验证码功能示例
  14. spring---FactoryBean与BeanFactory的区别
  15. 方维短信接口常见的问题汇总
  16. 今夏流行的十大避暑胜地
  17. input输入密码的时候调用纯数字键盘和加密,js弹出键盘
  18. 《解构产品经理互联网产品策划入门》PDF+《互联网产品运营产品经理的10堂精英课》PDF分析...
  19. 发现在创建云服务器ecs实例的磁盘快照时_阿里云服务器怎么重装系统 阿里云VPS如何重装系统...
  20. 【git】error: .repo/manifests/: contains uncommitted changes解决思路

热门文章

  1. Text file busy解决方法
  2. Java-Maven使用jwtt验证
  3. 发布博客支持关闭图片水印啦【CSDN产品周报第10期】
  4. 你开奖了吗?细数大厂春节红包背后的技术支撑
  5. 计算机桌面时间设置,电脑时间校准,教您怎么校正电脑时间
  6. UINO优锘:【万物可视系列之四】可视化“疏通”智慧港口数据“阻塞”
  7. 2021年金属非金属矿山(露天矿山)安全管理人员考试报名及金属非金属矿山(露天矿山)安全管理人员证考试
  8. win2008服务器虚拟内存设置,电脑虚拟内存设置(Win 7/8/10、Windows Server 2003 - 2019)...
  9. ICE笔记(02):简单的ICE通信应用-Hello World
  10. QQ通信原理及QQ是怎么穿透内网进行通信的?