from:https://www.jianshu.com/p/d6c8ca915f69

还是对计算机的监测,我们发现CPU负载和占用内存之间,存在正相关关系。

CPU负负载增加的时候占用内存也会增加:

假如我们有一个数据,x1的值是在 0.4 和 0.6 之间,x2的值是在 1.6 和 1.8 之间,就是下图中的绿点:

它明显偏离了正常的范围,所以是一个异常的数据。

但如果单独从CPU负载和占用内存的角度来看,该数据却是混杂正常数据之中,处于正常的范围:

这个异常的数据会被认为是正常的,因为我们得到模型的轮廓图是这样的:

为了改良这样的情况,我们需要把特征之间的相关性考虑进来。

第一种方式我们在上一篇笔记中有提到,就是增加一个新的特征 x3,把两者的相关性考虑进去:

另一种方式:多元高斯分布(Multivariate Gaussian Distribution),自动捕捉特征之间的相关性,公式如下:

其中 μ 为特征的均值,是一个 n*1 的向量:

Σ 为 特征的协方差,是一个 n*n 的矩阵:

假设我们的均值与协方差的初始值和对应的三维图形与轮廓图如下:

μ 决定的是中心的位置,改变 μ 的值意味着中心的移动

协方差矩阵控制的是对概率密度的敏感度。

例如某个方向的协方差越小,那么随着在该方向上的水平位移,高度的变化就越大。

首先我们看看各个特征不相关(正交)的情况:

我们再看一下考虑特征相关性的情况,下面两个图片分别到正相关和负相关的变化:

你看之前的模型 p(x) 会把异常数据认定为正常,而到了多元高斯分布的模型中,就得到了很好的解决:

之前的模型:

其实是多元高斯分布的一种特例,就是协方差矩阵 Σ 为对角矩阵的情况:

进行一个简单的推演你就明白了。

假设我们只有两个特征:

那么均值和协方差矩阵分别是:

把它们代入到多元高斯分布的公式中,可以推演得到:

二元高斯分布的密度函数,其实就是两个独立的高斯分部密度的乘积,特征更多的情况也是类似的。

需要注意的是,这里的推导不是证明的过程,仅仅是为了让你更好地理解两者的关系。

我们知道有这么两种方式可以处理特征之间的相关关系,那么应该如何选择呢?

这个需要根据具体的现实条件进行选择。

下表是两者的对比:

转载于:https://www.cnblogs.com/newbyang/p/10338697.html

多元高斯分布(Multivariate Gaussian Distribution)相关推荐

  1. 多元高斯分布(Multivariate Gaussian Distribution)(详细说明,便于理解)

    在深入了解多元高斯分布前,可以先了解一下一元高斯分布. 接下来对多元高斯分布进行详细的说明与推导. 对于 维的向量 (连续变量),多变量(多元, multivariate Gaussian)高斯分布形 ...

  2. 正态分布(Normal distribution)与高斯分布(Gaussian distribution)

    正态分布(Normal distribution)又名高斯分布(Gaussian distribution),是一个在数学.物理及工程等领域都非常重要的概率分布,在统计学的许多方面有着重大的影响力. ...

  3. 正态分布(Normal distribution)又名高斯分布(Gaussian distribution)

    正态分布(Normal distribution)又名高斯分布(Gaussian distribution),是一个在数学.物理及工程等领域都非常重要的概率分布,在统计学的许多方面有着重大的影响力. ...

  4. mysql 密度函数,高斯分布(Gaussian Distribution)的概率密度函数(probability density function)...

    高斯分布(Gaussian Distribution)的概率密度函数(probability density function) 对应于numpy中: numpy.random.normal(loc= ...

  5. 多元伯努利分布 multivariate bernoulli distribution

    今天看论文发现了一个名次,多元伯努利分布,百度好久也没查到明确的定义,去google了一下,发现其实就是 基本概统里的一次伯努利试验推广到多次试验后的结果分布,如下图: 引用来源: https://w ...

  6. 多元高斯分布是非参_多元高斯分布(多元正态分布)简介

    多元高斯分布(多元正态分布)简介 标签:#正态分布##统计基础##高斯分布# 时间:2017-01-28 23:02:43 作者:小木 高斯分布(Gaussian Distribution),也称作是 ...

  7. 多元函数的向量表示_多元高斯分布完全解析

    摘要 高斯分布被誉为"上帝的分布", 其强悍的建模能力和优美的数学性质使得高斯分布在现实中得到广泛的应用. 由中心极限定理 我们知道, 大量独立同分布的随机变量的均值在做适当标准化 ...

  8. 高斯分布Gaussian distribution、线性回归、逻辑回归logistics regression

    高斯分布Gaussian distribution/正态分布Normal distribution 1.广泛的存在 2020年11月24日,探月工程嫦娥五号探测器发射成功.其运转轨道至关重要,根据开普 ...

  9. 多元正态分布(Multivariate normal distribution)

    多元正态分布(Multivariate normal distribution) 前言 我们通常讨论正态分布都是在一元(univariate)的情况下,相信下面的定义大家都很熟悉了:假设随机变量XXX ...

最新文章

  1. TreeView和DataGridView控件组合使用
  2. Lesson 8.18.2 单层回归神经网络torch.nn.Linear实现单层回归神经网络的正向传播
  3. 笔记-信息系统开发基础-信息系统开发方法
  4. linux awk命令使用示例
  5. PostgreSql+PostGIS和uDig的安装
  6. Word2Vec小心得
  7. Java方法中的参数太多,第8部分:工具
  8. 2018-2019-1 《信息安全系统设计基础》教学进程
  9. 多个for语句嵌套执行顺序_阿里真实面试题解析之实现多个线程顺序执行的几种方式...
  10. 今日恐慌与贪婪指数为65 等级转为贪婪
  11. 开源文化依旧熠熠生辉 —— 在openEuler社区,有技术、有idea,你就是主角
  12. OpenStack源码系列---nova-conductor
  13. vs调试时查看指针指向的内存区域的内容
  14. 超详细的UI设计软件教程与资料
  15. 罗技驱动HUB安装,安装不上,一次性解决问题
  16. 如何利用用户ID号、关键词或视频时长在自媒体视频软件上批量采集下载关于在自媒体视频软件上批量采集...
  17. java jar apktool,apktool.jar
  18. NCRE-嵌入式系统开发工程师-操作系统知识整理
  19. 如何关闭win10自带杀毒?
  20. CSDN之每日IT冷知识答案大全

热门文章

  1. redhat Nginx 安装
  2. 【转】使用 vim + ctags + cscope + taglist 阅读源码
  3. 转自把《编程珠玑》读薄
  4. cocos2d-xna在使用某些场景转换效果时的问题以及修复
  5. 患者是否应该主动关注医疗知识
  6. 是否应该频繁升级小米的系统?
  7. genymotion无法安装apk的问题
  8. wine运行bat文件
  9. sbt構建一個spark工程(scala+spark+sbt)
  10. linux的open的非组赛,Linux下的非阻塞IO库epoll