一、均值(期望)、方差、标准差

下面给出这些概念的公式描述:

均值(期望):

方差:

标准差:

均值(期望)描述的是样本集合的中间点(平均值),但是它告诉我们的信息是有限的,而标准差给我们描述的是样本集合的各个样本点到均值的距离之平均。

以这两个集合为例,[0, 8, 12, 20]和[8, 9, 11, 12],两个集合的均值都是10,但显然两个集合的差别是很大的,计算两者的标准差,前者是8.3后者是1.8。标准差小的距离均值较为集中。标准差描述的就是这种“散布度”
ps:之所以除以n-1而不是n,是因为这样能使我们以较小的样本集更好地逼近总体的标准差,即统计上所谓的“无偏估计”。而方差则仅仅是标准差的平方。

二、协方差和相关系数

要说协方差和相关系数,我们不得不提相关性,相关性是描述事物之间是否有关系的方法。

2.1有关系

专家表示,要买房的人越多(下图的城镇化率可以简单理解为进城买房的人数),房价就越高(数据来源):

从上图可以看出,房价与进城买房的人数成正比,两者的关系是正相关

城镇化除了推升城市房价之外,还有另外一个作用,降低出生率。城镇化和出生率之间的关系就是负相关

所以说,“城镇化是最好的避孕药”,不管在新加坡、日本、中国、美国都有这样的规律。城镇化一方面是推动买房人口的增加,一方面是出生人口的减少,那么未来房价会怎样?预测未来就是统计学家的重要工作。

2.2没关系

比如说买彩票,跟是否求神拜佛,是否洗手这些事没有关系的。

协方差、相关系数就是尝试找出两个随机变量之间具有什么样的关系。

2.3协方差

标准差和方差一般是用来描述一维数据的,但现实生活中我们常常会遇到含有多维数据的数据集。比如,一个人的身高和体重是否存在一些联系。协方差就是这样一种用来度量两个随机变量关系的统计量,我们可以仿照方差的定义,来度量各个维度偏离其均值的程度,所以协方差可以这样来定义:

协方差的结果有什么意义呢?

如果结果为正值,则说明两者是正相关的,也就是说一个人身高越高体重越重。
如果结果为负值, 就说明两者是负相关。
如果为0,则两者之间没有关系,身高和体重之间没有关联。

协方差容易受到数值大小的影响,如果

的值均扩大10倍,则
也会扩大,为了解决这个问题,我们把通常把协方差归一化,也就是相关系数。

2.4相关系数

相关系数消除了协方差 数值大小的影响。

对于

样本相关系数为:

其中

,
为标准差。

正相关: 0< r <=1
负相关: -1<= r <0
不相关: r=0 ,r=0代表不相关,并不一定独立。

相关文章:

马同学的文章中引入欧式距离和余弦距离来说明问题。尤其在3.3解释了样本相关系数就是余弦距离的论断,我不是很理解,2233。

https://blog.csdn.net/Tonywu2018/article/details/83902570​blog.csdn.net

方差 标准差_均值、方差、标准差、协方差、相关系数的概念及意义相关推荐

  1. python实现马科维茨模型的资本市场线_均值方差模型与资本市场线

    马科维茨在假设投资者以预期收益率的波动程度衡量风险且是理性的,在相同风险下追求最高收益率在相同收益率下要求最低的风险的条件下得到均值方差模型. 如图所示,阴影部分即可行集,即所有证券或组合的可选择集, ...

  2. matlab均值方差模型,马科维茨均值方差模型的Matlab实现(10页)-原创力文档

    马科维茨均值方差模型的Matlab 实现 假设投资者可选的基金如下:股票型基金-诺安高端制造股票 (001707).混 合型基金-嘉实主题新动力混合 (070021).债券型基金-博时裕瑞纯债债券 ( ...

  3. python算方差_python计算均值方差

    用Python求均值与方差,可以自己写,也可以借助于numpy,不过到底哪个快一点呢? 我做了个实验,首先生成9百万个样本: nlist=range(0,9000000) nlist=[float(i ...

  4. 图像的均值和方差python_python-绘制均值和标准差

    您可以通过以下示例找到答案:errorbar_demo_features.py """ Demo of errorbar function with different ...

  5. Case Study _均值方差模型 MatLab

    %%设置初始表格 Asset = { 'Bonds', 'Large-Cap Equities', 'Small-Cap Equities', 'Emerging Equities' }; Price ...

  6. 因子分析累计贡献率_累计方差贡献率_spss累计方差贡献率_因子分析方差贡献率...

    spss中因子方差贡献率–怎样用SPSS求方差贡献率和方差累计贡献率 analyze 下面选择 diemnsion reducation ,再选择factor 因子分析,把你需要计算方差贡献率的变量放 ...

  7. python 方差计算_计算方差图像python

    您可以使用numpy.lib.stride_tricks.as_strided获取图像的窗口视图:import numpy as np from numpy.lib.stride_tricks imp ...

  8. 不借助 matlab 内置函数,生撸均值方差模型

    不借助 matlab 内置函数,生撸均值方差模型 前言 我在之前的一篇文章中介绍了,如何使用 matlab 自带的函数(对象)portfolio,实现均值方差模型.matlab 内置的函数自然实用.但 ...

  9. 马科维茨均值方差模型

    马科维茨均值方差模型 马科维茨均值-方差模型为多目标优化问题,有效前沿即多目标优化问题的pareto解(风险一定,收益最大:收益一定,风险最小) 马科维茨模型以预期收益率期望度量收益,以收益率方差度量 ...

最新文章

  1. Prime Path(bfs)广度优先搜索
  2. Java多线程:线程8锁案例分析
  3. java-jpa-criteriaBuilder使用入门
  4. 开源组件ExcelReport 3.x.x 使用手册(为.netcore而来
  5. 如何给linux目录加密码,怎么只给一个文件夹的内容加密?
  6. SpringBoot迭代发布下的Jar瘦身实践
  7. ListView学习思维导图
  8. 源码编辑器怎么编出游戏_编辑游戏
  9. 2021年华中杯数学建模挑战赛A题马赛克瓷砖选色问题求解全过程文档及程序
  10. 用python编写程序实现分段函数的计算_编写程序,实现分段函数计算,如下表所示。 x y x0 0 0=x5 x 5=x10 3x-5 10=x20 0.5x-2 20=x 0_学小...
  11. java开发高薪工程师,Java开发工程师如何获得高薪
  12. 一个屌丝程序猿的人生(二十六)
  13. Windows mysql secure_file_priv 设置
  14. ROS——在Ubuntu18.04下基于ROS Melodic编译python3的cv_bridge
  15. Knowledge based | 如何获取某类肿瘤中所有已被报道的相关突变基因?
  16. Dev C++ 英文模式改成中文模式
  17. 游戏底特律:变人Loading动画效果实现
  18. 马氏距离进行离群值检测
  19. 电脑怎样设置桌面待办,桌面待办事项软件
  20. 关于new Map()

热门文章

  1. 上司问你“对进步有何想法?”别说“感谢领导”,高手都这样说
  2. excel减法函数_懂Excel的父母屌炸天:用excel教孩子加减法,效果堪比专业老师!...
  3. 人工智能(PythonWeb)—— JS
  4. (MAX第八篇)Python列表迭代及推导式(初级)
  5. OPENCV3.4.1 +win7 64位+VS2017
  6. 在html中常用于定义求婚,关于求婚的英文句子中英双译
  7. Python_子类调用父类的方法
  8. 我的世界服务器伤害显示mod,我的世界伤害与血量显示mod
  9. Microsoft Visual Basic/C++ Redistributable v0.56.0 开源VC运行库合集
  10. 微信8.0android版本,微信相继更新了 iOS 和 Android 的 8.0x 大版本更新