前言:

大部分时候我们都是观察多个X与一个Y之间的相关性(多对一),那如果是多个X与多个Y的相关性该如何分析相关性呢?

你可能会说我把y一个一个拿出来,有多少个y做多少次相关性分析不就行了吗?

答案是:当然不行,这样Y内部的相关性不就被你扼杀在摇篮之中了嘛。

有一种方法可以,它就是典型关联分析(Canonical Correlation Analysis,以下简称CCA),是最常用的挖掘数据关联关系的算法之一。

举个栗子:我们拿到两组数据,第一组是人身高和体重的数据,第二组是对应的跑步能力和跳远能力的数据。那么我们能不能说这两组数据是相关的呢?CCA就可以帮助我们分析这个问题。

一、CCA概述

咱们先回忆一下相关系数:

 它可以很好的帮我们分析一维数据的相关性,但是对于高维数据就不能直接使用了。

咱们开始推广一下:CCA使用的方法是将多维的X和Y都用线性变换为1维的X'和Y'(降维),然后再使用相关系数来看X'和Y'的相关性。

二、CCA的算法思想

用于高维或者多维的数据,我们一般会想到投影追踪法。

上面我们提到CCA是将高维的两组数据分别降维到1维,然后用相关系数分析相关性。但是有一个问题是,降维的标准是如何选择的呢?回想下主成分分析PCA,降维的原则是投影方差最大;再回想下线性判别分析LDA,降维的原则是同类的投影方差小,异类间的投影方差大。对于我们的CCA,它选择的投影标准是降维到1维后,两组数据的相关系数最大。

这样我们的目的就明确了,就是想要使X'和Y'的相关性达到最大。

假设我们的数据集是X和Y,令:

即我们想找到a、b使corr(X',Y')达到最大;

计算其二间的相关系数为:

这里我们可以联想到分式线性规划问题,采用的办法就是令D(X')=D(Y')=1,转化为求解a、b使cov(X',Y')最大;

再引入拉格朗日乘数法(具体推理过程在应用多元统计分析第四版朱建平书上的162页)

注:找到第一对(a1,b1)再继续找第二对的时候,要注意它与第一对之间的信息冗余,最好是找到与之正交的,这样才能保证两组变量内部的相关性没有被破坏。最多可以找到两组维数中的最小值那么多对(a,b)。(与主成分相似)

典型相关分析(CCA)相关推荐

  1. 典型相关分析(cca)原理_CCA典型关联分析原理与Python案例

    文章来源于"脑机接口社区" CCA典型关联分析原理与Python案例​mp.weixin.qq.com Rose今天分享一下CCA的相关原理以及Python应用,CCA在EEG等脑 ...

  2. 基于典型相关分析(CCA)的多元变化检测算法(MAD)

    基于典型相关分析的多元变化检测算法 1 典型相关分析(CCA) 2 多元变化检测(MAD) 3 实验 链接 多元变化检测算法(Multivariate Alteration Detection,MAD ...

  3. matlab CCA标准化,典型相关分析(CCA)附算法应用及程序

    <典型相关分析(CCA)附算法应用及程序>由会员分享,可在线阅读,更多相关<典型相关分析(CCA)附算法应用及程序(15页珍藏版)>请在人人文库网上搜索. 1.典范相关分析摘要 ...

  4. 典型相关分析(CCA)相关资料

    典型相关分析的基本思想 Canonical Correlation Analysis CCA典型相关分析 (canonical correlation analysis)利用综合变量对之间的相关关系来 ...

  5. 典型相关分析 python_CCA典型关联分析原理与Python案例

    点击上面"脑机接口社区"关注我们 更多技术干货第一时间送达 Hello,大家好! Rose今天分享一下CCA的相关原理以及Python应用,CCA在EEG等脑电数据的特征提取中使用 ...

  6. 典型相关分析python实现_CCA典型关联分析原理与Python案例

    文章来源于"脑机接口社区"CCA典型关联分析原理与Python案例​mp.weixin.qq.com Rose今天分享一下CCA的相关原理以及Python应用,CCA在EEG等脑电 ...

  7. 数学建模 典型相关分析Canonical Correlation analysis

    典型相关分析CCA和主成分分析PCA非常相似,都是通过现有变量的线性组合构造新的综合变量以实现减少变量数目但代表几乎同样多的信息的目的.只是CCA分析的是两组变量,是要把每一组变量用一个线性组合综合变 ...

  8. 典型相关分析(Canonical Correlation Analysis,CCA)原理及Python、MATLAB实现

    随着对CCA的深入研究,是时候对CCA进行一下总结了. 本菜鸡主要研究方向为故障诊断,故会带着从应用角度进行理解. 典型相关分析 基本原理 从字面意义上理解CCA,我们可以知道,简单说来就是对不同变量 ...

  9. CCA:典型相关分析

    1.典型相关分析的基本思想 首先,什么是非典型的即经典的相关分析.给你两组变量X=[x1,x2,...,xm],Y=[y1,y2,...,yn],要研究X和Y之间的相关性,就是要得到一个X和Y的协方差 ...

  10. 典型相关分析(Canonical Correlation Analysis, CCA)

    文章目录 一 什么是典型相关分析 二 基本概念 1 典型变量(Canonical Variates) 2 补充概念 三 典型相关分析 一 什么是典型相关分析 用来探索两个向量之间的关联关系的,这两个向 ...

最新文章

  1. 【小知识点】解决Chrome动画”卡顿”的办法
  2. Keras之DNN:利用DNN算法【Input(8)→12+8(relu)→O(sigmoid)】利用糖尿病数据集训练、评估模型(利用糖尿病数据集中的八个参数特征预测一个0或1结果)
  3. mysql行复制_MySQL复制(一)--复制概述
  4. CMake 用法导览
  5. j2ee可以用于前端开发吗_用于J2EE开发的Cloud IDE
  6. php分区表,【MYSQL】分区表
  7. 将房子卖了五百万,存在银行,靠利息能过日子吗?
  8. 开发Adobe AIR移动应用程序的考虑事项
  9. 分布式链路追踪(Sleuth、Zipkin)
  10. 九江职业学院计算机专业怎么样,请问九江职业大学和九江职业技术学院,相比之下哪个好一点?...
  11. autojs之提取图片中的红色文字(通过找边界进行裁剪)
  12. KindEditor上传本地图片
  13. matplotlib之等高线图
  14. 怎样自动关闭计算机,如何设置电脑自动关机,教您电脑怎样设置自动关机
  15. 自己编写的bug管理系统
  16. php批量随机生成数字不重复,php批量随机生成数字不重复
  17. 1.19 Cubemx_STM32F4 TIM(五)---- 总结
  18. 怎么批量删除qq空间说说
  19. Android Firebase 服务简介
  20. Java网络商城项目 SpringBoot+SpringCloud+Vue 网络商城(SSM前后端分离项目)十四(Spring Data Elasticsearch,将数据添加到索引库)

热门文章

  1. Ubuntu 安装 Libmodbus
  2. 如何利用网管软件管控SNMP协议的网络设备
  3. pdf转cad格式工具控件pdf2cad
  4. linux测试硬盘读写速度
  5. 用java怎么做微信公众号,用Java搭建微信公众号(一)构建基础请求框架
  6. winhex使用教程_[攻略] 无限视距——上帝视角教程
  7. Android Studio快捷键设置 (实现原eclipse ctrl+m 代码全屏的效果)
  8. 数电 3 逻辑门电路
  9. SPSS的中分层聚类法的实际应用详解
  10. 如何激活Windows Server 2008 R2