
In multivariate statistics and probability theory, the scatter matrix is a statistic that is used to make estimates of the covariance matrix, for instance of the multivariate normal distribution.


Given n samples of m-dimensional data, represented as the m-by-n matrix, X = [ x 1 , x 2 , . . . , x n ] X=[x_1,x_2,...,x_n] X=[x1​,x2​,...,xn​], the sample mean is
x ‾ = 1 n ∑ j = 1 n x j \overline x=\frac{1}{n}\sum_{j=1}^nx_j x=n1​j=1∑n​xj​

where x j x_j xj​ is the j-th column of X.

The scatter matrix is the m-by-m positive semi-definite matrix(协方差矩阵也是)

S = ∑ j = 1 n ( x j − x ‾ ) ( x j − x ‾ ) T = ∑ j = 1 n ( x j − x ‾ ) ⊗ ( x j − x ‾ ) = ( ∑ j = 1 n x j x j T − n x ‾ x ‾ T ) S=\sum_{j=1}^n(x_j-\overline x)(x_j-\overline x)^T=\sum_{j=1}^n(x_j-\overline x)\otimes(x_j-\overline x)=\bigg(\sum_{j=1}^nx_jx_j^T-n\overline x \overline x^T\bigg) S=j=1∑n​(xj​−x)(xj​−x)T=j=1∑n​(xj​−x)⊗(xj​−x)=(j=1∑n​xj​xjT​−nxxT)
where T denotes matrix transpose, and multiplication is with regards to the outer product. The scatter matrix may be expressed more succinctly (简洁地) as
S = X C n X T S=XC_nX^T S=XCn​XT

where C n C_n Cn​ is the n-by-n centering matrix.

Outer product: u ⊗ v = u v T u\otimes v=uv^T u⊗v=uvT
还不懂看这个:Outer product - Wikipedia

Centering matrix multiplied with a vector has the same effect as subtracting the mean of the components of the vector from every component of that vector.
Centering matrix - Wikipedia


C M L = 1 n S C_{ML}=\frac{1}{n}S CML​=n1​S


The maximum likelihood estimate, given n samples, for the covariance matrix of a multivariate normal distribution can be expressed as the normalized scatter matrix
When the columns of X are independently sampled from a multivariate normal distribution, then S has a Wishart distribution.

散布矩阵(Scatter Matrix)及其与协方差矩阵(The Covariance Matrix)的关系相关推荐

  1. 加权协方差矩阵(weighted covariance matrix)

    国内完全没一个有用的,这里给出了加权协方差矩阵计算函数.用的时候可以将权重先归一化. def weighted_cov(values, weights):"""Compu ...

  2. 协方差矩阵(covariance matrix)

    Xn×d⇒(XTX)d×d X_{n\times d}\Rightarrow \left (X^TX\right )_{d\times d} (1)协方差矩阵:半正定(semi-positive de ...

  3. 散布矩阵(Scatter Matrix)

    转载自http://blog.csdn.net/breeze5428/article/details/25612763,仅用作个人学习. 参考网页:http://en.wikipedia.org/wi ...

  4. R语言使用psych包进行探索性因子分析EFA、使用cov2cor函数将原始数据的协方差矩阵将其转换为相关性矩阵( covariance matrix into correlation matrix)

    R语言使用psych包进行探索性因子分析EFA.使用cov2cor函数将原始数据的协方差矩阵将其转换为相关性矩阵( covariance matrix transform into correlati ...

  5. matlab类间散度矩阵,协方差矩阵和散布矩阵(散度矩阵)的意义

    在机器学习模式识别相关算法中,经常需要求样本的协方差矩阵C和散布矩阵S.如在PCA主成分分析中,就需要计算样本的散度矩阵,而有的教材资料是计算协方差矩阵.实质上协方差矩阵和散度矩阵的意义就是一样的,散 ...

  6. 如何理解协方差矩阵(散布矩阵)

    这学期开了模式识别的学习课程,经常提到概率论与数理统计的一个概念:协方差矩阵(在模式识别中又叫散布矩阵).理解这个矩阵严格意义上来说其实不需要太多先导知识,我们只需要了解一些线性代数基本的概念.但是你 ...

  7. 协方差矩阵和散布矩阵(散度矩阵)的意义

    协方差矩阵和散布矩阵的意义     [尊重原创,转载请注明出处]http://blog.csdn.net/guyuealian/article/details/68922981 在机器学习模式识别中, ...

  8. 散布矩阵(scatter_matrix)及相关系数(correlation coefficients)实例分析

    在进行机器学习建模之前,需要对数据进行分析,判断各特征(属性,维度)的数据分布及其之间的关系成为十分必要的环节,本文利用Pandas和Numpy的散布矩阵函数及相关系数函数对数据集特征及其关系进行实例 ...

  9. 【Matlab】错误使用 classify (line 233) The pooled covariance matrix of TRAINING must be positive definite.

    在 Matlab 用 Classify 函数做判别分析时,有时会碰到下面的问题: 错误使用 classify (line 233) The pooled covariance matrix of TR ...


  1. 搞懂Kafka的这个问题,你离大厂就不远了!
  2. 微型计算机存取速度,微型计算机中,存取速度由快到慢排序:
  3. Android中用图片自定义一个进度条(实现蒙板效果)
  4. python 统计使用技巧
  5. UVA - 1604Cubic Eight-Puzzle立体八数码
  6. Mysql 会导致锁表的语法
  8. 漂亮实用的loading(加载)封装
  9. 关于破解百度文库的方法(非常实用)
  10. Java内存映射原理与实现
  11. java速学堂,速学堂 JAVA300 第四章练习
  12. MacOS 显示隐藏文件快捷键
  13. 验证码的实现 与jQuery阻止跳转封装数据库工具类oracle
  14. backdrop-filter 与 filter 模糊效果的区别
  15. Android多窗口分屏(原生方法)
  16. python绘图用什么软件_作图用什么软件比较好?
  17. 《统计建模与R软件》第三章课后习题3.5-3.11解题答案
  18. json能传数字,不能传字符串
  19. thinkphp5 使用ElasticSearch 做搜索
  20. 嵌入式工程师学习第二天


  1. 质量效应:仙女座 - 概念艺术
  2. Python操作三大主流数据库
  3. Linux 上安装 MySQL 客户端
  4. git idea 如何删除本地分支_git删除本地分支和删除远程分支
  5. 万字计算机网络知识汇总
  6. centos安装pssh
  7. Ascll、Ansi、Unicode、UTF8
  8. Gitflow有害论
  9. 计算机技术员英语怎么说,技术员英语怎么说,技师用英文怎么说!
  10. UE4编辑器语言设置