卡方检验是一种检验两个变量独立性的方法。本文将介绍其理论并给出其应用在LBP特征匹配中的例子。

卡方检验最基本的思想就是通过观察实际值与理论值的偏差来确定理论的正确与否。具体做的时候常常先假设两个变量确实是独立的(行话就叫做“原假设”),然后观察实际值(也可以叫做观察值)与理论值(这个理论值是指“如果两者确实独立”的情况下应该有的值)的偏差程度,如果偏差足够小,我们就认为误差是很自然的样本误差,是测量手段不够精确导致或者偶然发生的,两者确确实实是独立的,此时就接受原假设;如果偏差大到一定程度,使得这样的误差不太可能是偶然产生或者测量不精确所致,我们就认为两者实际上是相关的,即否定原假设,而接受备择假设。

那么用什么来衡量偏差程度呢?假设理论值为E(这也是数学期望的符号哦),实际值为x,如果仅仅使用所有样本的观察值与理论值的差值x-E之和:

来衡量,单个的观察值还好说,当有多个观察值x1,x2,x3的时候,很可能x1-E,x2-E,x3-E的值有正有负,因而互相抵消,使得最终的结果看上好像偏差为0,但实际上每个都有偏差,而且都还不小!此时很直接的想法便是使用方差代替均值,这样就解决了正负抵消的问题,即使用

这时又引来了新的问题,对于500的均值来说,相差5其实是很小的(相差1%),而对20的均值来说,5相当于25%的差异,这是使用方差也无法体现的。因此应该考虑改进上面的式子,让均值的大小不影响我们对差异程度的判断,式(1):

上面这个式子已经相当好了。实际上这个式子就是开方检验使用的差值衡量公式。当提供了数个样本的观察值x1,x2,……xi ,……xn之后,代入到式(1)中就可以求得开方值,用这个值与事先设定的阈值比较,如果大于阈值(即偏差很大),就认为原假设不成立,反之则认为原假设成立。

那如果将卡方检验用在图像特征匹配上,可以将已有图像的每个特征作为均值(或者多个图像的特征取平均值作为均值)E,而待匹配图像特征作为变量​xi,按照式子(1)进行独立性检验,如果检验结果小于阈值,则可认为待匹配图像和原图像是相同的。

举个例子,在LBP人脸识别中,每个图像可以被分割成大小相同的N块区域,在这些小区域中利用LBP提取直方图特征,这样每个图像就得到了很多直方图信息,设待匹配图像的直方图为Si,j,已知图像的直方图为Mi,j,其中i=1,2,...,N为图像的某块小区域,j为小区域内直方图的某一列的值,则两幅图像的相似性为:

其中wj是每块小区域的权重,比如在人脸区域中,眼睛嘴巴等区域包含的信息量更为丰富,那么这些区域的权重就可以设置的大一些。上式中的分母部分为Si,j+Mi,j,可能是考虑到相同人脸在不同照片中的差异性。

以上理论部分参考自:http://www.blogjava.net/zhenandaci/archive/2008/08/31/225966.html

卡方检验(Chi square statistic)相关推荐

  1. 寻根究底,探讨 chi -square特征词选择方法后面的数学支持

    寻根究底,探讨 chi -square特征词选择方法后面的数学支持 最近研究特征词选择算法,主要在研究chi方统计量的方法. Christopher D Manning的书<信息检索导论> ...

  2. 人脸识别经典算法二:LBP方法

    LBP(Local Binary Patterns,局部二值模式)是提取局部特征作为判别依据的.LBP方法显著的优点是对光照不敏感,但是依然没有解决姿态和表情的问题.不过相比于特征脸方法,LBP的识别 ...

  3. 图像处理理论(七)——LBP, Fisherface, Viola-Jones

    LBP(续) 圆形LBP算子 基本的LBP算子的最大缺陷在于它只覆盖了一个固定半径范围内的小区域,这显然不能满足不同尺寸和频率纹理的需要.为了适应不同尺度的纹理特征,并达到灰度和旋转不变性的要求,Oj ...

  4. 主成分分析、因子分析及其有关的数学基础

    1.相关矩阵 2.单位矩阵 3.旋转 正余弦公式: https://baike.baidu.com/item/%E4%B8%89%E8%A7%92%E5%87%BD%E6%95%B0%E5%85%AC ...

  5. 电子系统健康管理预测学习笔记

    文章目录 电子系统健康管理与预测 第一章 健康管理的概念和方法 保险丝和金丝雀 故障前兆的监测和推理 监测环境和使用载荷,建立基于pof的应力和损伤模型 PHM 在复杂系统中的实现 第二章 PHM传感 ...

  6. 统计学概览与统计检验总结

    统计学的数据类型 常用统计描述 统计学的五大内容:数据描述与可视化,参数估计,假设检验,相关分析,回归分析. 数据描述:即统计描述,描述数据的主要特点. 参数估计:由采集的数据集估计某个参数. 假设检 ...

  7. fcbf特征选择步骤_一文读懂 聚类特征选择

    <Feature Selection for Clustering:A Review> 0.1 introduction介绍 高通量技术导致数据维度以及样本数量呈指数增长,使得对数据集进行 ...

  8. 数据分享|R语言因子分析、相关性分析大学生兼职现状调查问卷数据可视化报告...

    全文链接:http://tecdat.cn/?p=31765 随着大学的普及教育,大学生就业形势变得更加困难,很多学生都意识到这个问题(点击文末"阅读原文"获取完整代码数据). 相 ...

  9. 《量化金融R语言高级教程》一2.2 在R中建模

    本节书摘来异步社区<量化金融R语言高级教程>一书中的第2章,第2.2节,作者: [匈牙利]Edina Berlinger(艾迪娜•伯林格) , 等 译者: 高蓉 责编: 胡俊英,更多章节内 ...

最新文章

  1. 多个文件中的数据处理,输出自己想要是数据
  2. iOS 中KVC、KVO、NSNotification、delegate 总结及区别
  3. SQLServer2000数据库特有的1433端口号
  4. python实现轨迹回放供应_运动轨迹回放 百度地图api示例源码
  5. iphone相册怎么加密_iOS限免推荐|视频滤镜和转场、专属加密应用、照片动画等共 5 款...
  6. 接口测试——测试用例执行
  7. mysql awr 上海用户组_AWR-mysql教程-PHP中文网
  8. MATLAB中的Hough变换
  9. R语言求和上三角矩阵
  10. 软测工具Testbed的使用以及动态测试实例
  11. 一般系统论的基本概念
  12. python画circos图_CIRCOS圈图绘制 – 最简单绘图和解释
  13. 利用Md2all的自定义CSS,给Markdown一个漂亮的排版
  14. 对象base64转码_Base64编码转换
  15. OV9281+RK3399Pro 双摄像头移植
  16. java下雪_下雪屏保java,基础
  17. Mac Mounty挂载NTFS硬盘报错
  18. 并查集:CDOJ1593-老司机破阵 (假的并查集拆除)
  19. POI导出Excel工具类(简单看完就会)
  20. DL之DSSD:DSSD算法的简介(论文介绍)、架构详解、案例应用等配图集合之详细攻略

热门文章

  1. java中的日期格式转换
  2. UINavigation导航栏和UITabbar布局和样式
  3. 毕业设计 STM32天气预报盒子 - 嵌入式 单片机 物联网
  4. CF975C Valhalla Siege 题解
  5. 浅谈FromHandle
  6. Vue如何使用iconfont(阿里图标库)
  7. 2022年建筑装饰行业报告:企业微网蓄势待发,万亿赛道谁主沉浮?
  8. 微信公众号开发(JAVA)-环境搭建与开发接入
  9. java tcc事务 例子_分布式事务之TCC事务模型
  10. 分析ANR具体哪个函数耗时,打时间戳是什么意思