遇到了一个计算方差时的问题。

先贴一个方差的计算公式:


计算方差时,可以直接使用 numpy 中的 var 函数。

然而直接使用var之后发现和正确答案的方差不匹配。。。

通过查了资料以后发现,var默认是总体方差(计算时除以样本数 N),若需要得到样本方差(计算时除以 N - 1),需要加参数 ddof = 1。

例如:

import numpy as np
a= [1,2,3,4,5]
np.var(a) // 计算总体方差
//  output: 2.0
np.var(a,ddof = 1) // 计算样本方差
// output : 2.5

那为什么会出现这两种不同的方差嘞?

这涉及到了贝塞尔校正(Bessel’s Correction),有两个不同的概念,总体方差(standard variation)和样本方差(sample variation)。Python求值的时候默认是除以N的,也就是有偏的,而在有时使用时会用到无偏,即除以N-1。

当我们对数据进行统计时,由于用到了每一个数,所以得到的结果是符合总体规律特征的,但是当数据量足够庞大以后,就需要从总体中抽选样本,该样本当中的数据会在总体的某个范围之内。为了修正这个偏差,在计算样本的方差和标准差时,我们将使用 n-1 代替 n。

也是因为均值已经用了n个数的平均来做估计在求方差时,只有(n-1)个数和均值信息是不相关的。而第n个数已经可以由前(n-1)个数和均值来唯一确定,实际上没有信息量。所以在计算方差时,只除以(n-1)。

参考:

Bessel’s correction - Wikipedia

統計學中算變異量為什麼要除以n-1?什麼是「自由度」?- 林澤民的部落格 - udn部落格

https://www.bilibili.com/read/cv3138196

一个关于var函数计算方差 / 标准差的问题相关推荐

  1. R语言sd函数计算数值标准差实战(Standard Deviation)

    R语言sd函数计算数值标准差实战(Standard Deviation) 目录 R语言sd函数计算数值标准差实战(Standard Deviation) #基本语法 #sd

  2. R语言使用car包的vif函数计算方差膨胀因子,并基于方差膨胀因子开方后和阈值(2)的判断来确认模型特征(预测变量)之间是否存在多重共线性(Multicollinearity)

    R语言使用car包的vif函数计算方差膨胀因子,并基于方差膨胀因子开方后和阈值(2)的判断来确认模型特征(预测变量)之间是否存在多重共线性(Multicollinearity) 目录

  3. hive -- stddev , stddev_pop , stddev_samp , var_pop , var_samp(计算方差标准差等)

    标准差是方差的平方根  1.方差公式:  m为x1,x2-xn数列的期望值(平均数)  s^2 = [(x1-m)^2 + (x2-m)^2 + - (xn-m)^2]/n  s即为标准差  s^2为 ...

  4. 使用R计算方差和标准差

    第一个例子: > x <- c(2.5,0.5,2.2,1.9,3.1,2.3,2,1,1.5,1.1) > y <- c(2.4,0.7,2.9,2.2,3.0,2.7,1. ...

  5. 函数计算的开发与配置

    作者 | 夏莞 阿里云函数计算开发工程师 导读: 在本篇文章中"基本概念"部分主要对函数计算最核心的概念进行详细介绍,包括服务.函数.触发器.版本.别名以及相关的配置:" ...

  6. 从零入门 Serverless | 函数计算的开发与配置

    作者 | 孔德慧(夏莞)  阿里云函数计算开发工程师 来源 | Serverless 公众号,本文整理自<Serverless 技术公开课> 导读:在本篇文章中,"基本概念&qu ...

  7. 轻松实现函数计算文件上传下载

    简介:这是一个包含了函数计算每种 Runtime 结合 HTTP Trigger 实现文件上传和文件下载的示例集.我们知道不同语言在处理 HTTP 协议上传下载时都有很多中方法和社区库,特别是结合函数 ...

  8. 使用 OpenAI、阿里云函数计算平台和 PyQt5 创造智能图片生成器

    使用 OpenAI.阿里云函数计算平台和 PyQt5 创造智能图片生成器 0. 效果演示 1. 引言 随着人工智能技术的不断发展,越来越多的应用开始融入我们的生活.在这篇博客中,我将介绍如何利用 Op ...

  9. python使用numpy中的np.mean函数计算数组的均值、np.var函数计算数据的方差、np.std函数计算数组的标准差

    python使用numpy中的np.mean函数计算数组的均值.np.var函数计算数据的方差.np.std函数计算数组的标准差 目录

  10. MATLAB的var与std函数 与 均值,方差,标准差,均方差,均分误差

    从定义上来讲,(样本)均值,方差,标准差,均方差,均分误差分别为: 均值: 方差: 标准差: 均方差=标准差 均方误差: matlab中的var函数和std函数用来计算方差 var函数计算使用的公式为 ...

最新文章

  1. WINCE的内存配置-config.bib文件的解析
  2. mysql查询不同老师所教不同课程_mysql学习训练记录及笔记(二)
  3. ETL作业调度软件TASKCTL自定义扩展作业类型插件安装
  4. 百度在线编辑器 显示html,UEditor百度编辑器中JS/html代码(script标签)被过滤的解决办法...
  5. 图神经网络(GNN)模型原理及应用综述
  6. 测试鼠标宏软件,Mini Mouse Macro(鼠标宏设置工具)
  7. 子类化和超子类化http://www.cppblog.com/wangjia184/archive/2008/03/27/45520.html
  8. 要学习使用 calib3D 模块在图像中创建 3D 效果-姿势估计
  9. 【杂记】01:王者荣耀,再见?
  10. C++把十进制转换为其他进制的方法
  11. h5案例分享 华谊电影《老炮儿》约战
  12. 格兰富Grundfos CM3-2 A-R-A-E-AVBE F-A-A-N
  13. flink学习(五)DataStream API
  14. VoLTE、VoWiFi和VoIP有什么不同?
  15. MPEG4视频编码技术介绍
  16. Cocos2dx 集成CryptoPP
  17. 无魔法插件 - ChatGPT Sidebar with GPT-4
  18. rust加速python
  19. 微信支付API v3 Native支付
  20. 高精度加法【c++实现】

热门文章

  1. 如何使用码云Gitee上传本地项目
  2. 唯一索引(unique index)的创建和使用
  3. 【新手指南】App原型设计:如何快速实现这6种交互效果?
  4. python 识别图片上的数字
  5. 数字图像字符识别——数字识别
  6. puzzle(102)数独
  7. PhpStorm设置格式化代码快捷键
  8. Android实现查看预览PDF文件功能
  9. 天津90、北京54坐标和WGS84坐标
  10. 【数字IC】深入浅出理解UART协议