为什么样本方差(sample variance)的分母是 n-1?
参考文章:https://www.zhihu.com/question/20099757
@茉茉 @魏天闻 @马同学 三名高赞回答
2021.10.30
1. 为什么方差(sample variance)公式分母是n-1
S2=1n−1∑i=1n(Xi−Xˉ)2S^2= \frac{1}{n-1}\sum_ {i=1}^n(X_i-\bar{X})^2S2=n−11i=1∑n(Xi−Xˉ)2
- 计算公式里分母为n-1的目的是为了让方差的估计是无偏的,也就是修正后的。
- 而S2=1n∑i=1n(Xi−Xˉ)2S^2= \frac{1}{n}\sum_ {i=1}^n(X_i-\bar{X})^2S2=n1∑i=1n(Xi−Xˉ)2是有 bias。
E[(Xi−μ)2]=E[1n∑i=1n(Xi−μ)2]=σ2E[(X_i-\mu)^2]=E[ \frac{1}{n}\sum_ {i=1}^n(X_i-\mu)^2]=\sigma^2 E[(Xi−μ)2]=E[n1i=1∑n(Xi−μ)2]=σ2
- σ2\sigma^2σ2是方差;
- μ\muμ是随机变量X的数学期望
- 这是个无偏估计,分母不偏不倚正好是n
也就是说当公式μ换成了Xˉ\bar{X}Xˉ公式分母从n换成了n-1。为何?
2. 图像理解误差的存在
- 假设分布正态,我们真实期望是 μ\muμ,但我们不知道
- 我们统计得到的期望是Xˉ\bar{X}Xˉ,
为什么样本方差(sample variance)的分母是 n-1? - 马同学的回答 - 知乎
https://www.zhihu.com/question/20099757/answer/312670291
- 除非 已知数据求到的期望Xˉ\bar{X}Xˉ 正正好与 真实分布期望 μ\muμ 相等,否之一定会有:
为什么样本方差(sample variance)的分母是 n-1? - 魏天闻的回答 - 知乎
https://www.zhihu.com/question/20099757/answer/26586088
也是就 我们真实的分布 和 通过数据估算出来的分布有一定差距,只有正好Xˉ=μ\bar{X}=\muXˉ=μ时候没有误差。
3. 误差有多大
为什么样本方差(sample variance)的分母是 n-1? - 茉茉的回答 - 知乎
https://www.zhihu.com/question/20099757/answer/13971886
为什么样本方差(sample variance)的分母是 n-1?相关推荐
- 【转载】为什么样本方差(sample variance)的分母是 n-1?
作者:茉茉 链接:https://www.zhihu.com/question/20099757/answer/13971886 来源:知乎 著作权归作者所有.商业转载请联系作者获得授权,非商业转载请 ...
- python线性回归分析看相关性_机器学习入门-相关分析之简单线性回归
一.什么是机器学习? 简单来说,机器学习是一类算法的总称,这些算法企图从大量历史数据中挖掘出其中隐含的规律,并用于预测或者分类,更具体的说,机器学习可以看作是寻找一个函数,输入是样本数据,输出是期望的 ...
- python相关性分析函数_python实现相关性分析
从网上记录的一篇如何用python实现相关性分析的文章 ,先摘录,我再一一实现. 概述 在我们的工作中,会有一个这样的场景,有若干数据罗列在我们的面前,这组数据相互之间可能会存在一些联系,可能是此增彼 ...
- Pattern Recognition And Machine Learning 第一章
目录 1 绪论 1.1 例子:多项式曲线拟合 1.2 概率论(参考) 1.2.1 概率密度(参考) 1.2.2 期望和协方差(参考.参考.参考) 1.2.3 贝叶斯概率(参考.参考) 1.2.4 高斯 ...
- 概率论与数理统计专业术语
Termilology 区间估计 interval estimation 对立 Conplementation 卷积 Convolution 方差 variance 协方差 covariance 基本 ...
- 机器学习复习:线性回归1
Simple Linear Regression (简单的线性回归) 相关变量 example: 在过去的一个月里,猪肉的价格从8元一斤一路涨到了20元一斤.市面上的肉夹馍也逐渐从10元一个涨到了15 ...
- 使用java计算数组方差和标准差
使用java计算数组方差和标准差 觉得有用的话,欢迎一起讨论相互学习~ 首先给出方差和标准差的计算公式 代码 public class Cal_sta {double Sum(double[] dat ...
- 统计-样本及抽样分布
第六章 样本及抽样分布 在概率中,我们所研究的随机变量的分布都是假设已知的. 在数理统计中,我们研究的随机变量的分布是未知的,或者是不完全知道的.我们通过对随机变量进行大量重复.独立的观察,收集书记, ...
- bootstrap再抽样_【机器学习】Bootstrap详解
Bootstrap简介Bootstrap方法是非常有用的一种统计学上的估计方法,是斯坦福统计系的教授Bradley Efron(我曾有幸去教授办公室约谈了一次)在总结.归纳前人研究成果的基础上提出一种 ...
最新文章
- R语言实战应用精讲50篇(二十七)-时空数据分析-经验空间/时间均值(latex公式+R代码绘图)
- Vue.js 生产环境部署
- java 命令行导入jar包,如何使用命令行生成和导入jar包
- [Elasticsearch2.x] 多字段搜索 (三) - multi_match查询和多数字段 译
- should,would,could,must,might,may,can有什么区别
- redis 相关操作
- RabbitMQ—集群原理
- android简单小项目实例_自学(系统学)Python了那么久, 想就业? 几个简单小项目让你通过面试!...
- (11)数据分析-TableOne工具
- OpenCV教程:超详细的OpenCV入门教程,值得收藏
- 28岁功能测试被辞,最后结局令人感慨...
- 【AE表达式】300多个人名正从宇宙中飞来……
- CSS水平居中,垂直居中,水平垂直居中
- 不越狱将ipa安装到iphone
- Step7中有关时间和定时器的使用和例程2
- DeflateRect
- MacBook 无法连接公司内网服务器
- i5 1035G4和i5 1035G1 哪个好
- 开发App,如何更好的进行技术选型
- Unity3d地形反光
热门文章
- Excel无法显示0.00或者0值
- pivot position_Pivot轴心点
- ESC快速关闭windows资源管理器窗口源码
- 从零开发短视频电商 利用CDN加速OSS图片传输
- Nuget 401 Unauthorized 错误
- uni-app Wap2app生成的app跳转第三方页面,再返回的问题
- SUPPORTS, REQUIRED ,REQUIRES_NEW的区别
- P1542 包裹快递 㵘淼沝水题解
- Android 7.0之访问文件的权限和FileProvider类
- Shell入门笔记:Linux批量提取文件名/shel文件名提取日期/NCL批量读取文件(shell脚本结合)