样本方差计算中,取值n-1的依据:

数学理论依据:

https://www.zhihu.com/question/28964121

作者:Yeung Evan
链接:https://www.zhihu.com/question/28964121/answer/289715220
来源:知乎
著作权归作者所有。

样本方差的表达式除以 而不是除以 真的是日经话题。实际上,唯一的解释是除以 的定义式可以使得样本方差 作为对总体方差 的估计量,是无偏的。

换句话说,设 是从(总体)均值为 (总体)方差为 的总体中的随机抽样,那么,样本均值定义为 ,样本方差定义为 就有如下结论: 。这就是无偏性的体现。这里注意,总体并不要求是正态总体,任意分布的总体均有如上的性质。

这里稍微提一下无偏性的重要性。实际上,要求统计量或者某个参数的估计量具有无偏性,比想象中要重要一些。比如你说,如果是有偏的话,那我最后估计的结果里减去偏差不就行了吗?这样做其实暗含了所谓的“偏差”你是知道具体是多少的,而且还暗含了“偏差”是个常数。而实际上,一个估计量有偏,当然可以偏得五花八门——从而造成了不能知道到底是多少。其次,如果对统计量理解深刻的话,你会知道我们所谓的点估计,实际上是使用一个随机变量(如这里的 )去估计一个参数的值(非随机变量),而随机变量是对应着有分布的(比如正态总体下, ),所以,即使总体的参数不变不同批次的样本 做出来的点估计(们)也是不一样的,而无偏性保证了,即使这些点估计们彼此不同,但如果批次 (不是样本 )越来越多,这些点估计们的柱状图画出来一定是围绕真实值 的正态分布。

如果你觉得上述分析是为了解释而解释,不太自然,那么可以考虑这样的例子。设 是从(总体)均值为 (总体)方差为 正态总体中的随机抽样,那么根据极大似然估计(MLE), (注意这里MLE解出来是除以 的)。不同的估计方法会有不同的统计量,比如,如果使用限制极大似然估计(REML),这里的估计就变成了 (注意这里的REML解出来是除以 的)。自然你会问,为啥两个方法结果不同?或者说REML到底限制了什么?这个时候,你再来用自由度解释:当 都是未知的时候,回忆你解MLE的过程,求导之后设为零,得到两个方程,而 是从第一个方程解出来的,也就是说不需要第二个方程就能解出 ,而将其带入第二个方程,才继续解出 。而MLE是不考虑求解过程细节的,所以得到的 都是除以 的;REML考虑到了这个细节,所以 是除以 的。

最后补充一下, 这种除以 作为总体方差的估计,有些时候也是有优势的,即使它是有偏的:比如,当 是已知时, 能到达C-Rao下界的;当 未知时,则C-Rao下界无法达到。

另外,也可参考:https://blog.csdn.net/Hearthougan/article/details/77859173

模型计算验证:

通过计算机建造模型,在一定程度上“穷举”方法进行实测验证,可更直观的验证数学理论的结果,不严谨。

样本标准差分母为何是n-1 - python_backup - 博客园  https://www.cnblogs.com/webRobot/p/7722820.html

样本方差之n-1理论推导及计算机实验证明相关推荐

  1. MSCKF理论推导与代码解析

    点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 在SLAM后端中,主要有两种主流方法用于优化:基于滤波的方法和基于非线性的方法.基于滤波的方法主要有M ...

  2. GAN完整理论推导与实现,Perfect!

    本文是机器之心第二个 GitHub 实现项目,上一个 GitHub 实现项目为从头开始构建卷积神经网络.在本文中,我们将从原论文出发,借助 Goodfellow 在 NIPS 2016 的演讲和台大李 ...

  3. UA MATH566 统计理论 推导卡方拟合优度检验

    UA MATH566 统计理论 推导卡方拟合优度检验 卡方拟合优度检验主要是检验categorical data的,假设一共有ddd种category,每一种理论比例为pip_ipi​,满足 ∑i=1 ...

  4. 机器学习入门学习笔记:(2.1)线性回归理论推导

    理论推导   机器学习所针对的问题有两种:一种是回归,一种是分类.回归是解决连续数据的预测问题,而分类是解决离散数据的预测问题.线性回归是一个典型的回归问题.其实我们在中学时期就接触过,叫最小二乘法. ...

  5. 四旋翼姿态解算——梯度下降法理论推导

    转载请注明出处:http://blog.csdn.net/hongbin_xu 或 http://hongbin96.com/ 文章链接:http://blog.csdn.net/hongbin_xu ...

  6. 【自适应盲均衡4】基于RLS的多径衰落信道均衡算法(RLS-CMA)的理论推导与MATLAB仿真

    关注公号[逆向通信猿]更精彩!!! 一.回顾CMA和MMA 对于前面两种算法 [自适应均衡]多径衰落信道的复数常模算法(CMA)的理论推导与MATLAB仿真 [自适应均衡]多模算法(MMA)--复数改 ...

  7. 【自适应盲均衡3】多模算法(MMA)——复数改进常模算法(MCMA)的理论推导与MATLAB仿真

    关注公号[逆向通信猿]更精彩!!! 接上篇[自适应均衡2]多径衰落信道的复数常模算法(CMA)的理论推导与MATLAB仿真 理论推导 MMA或者MCMA其实是在CMA基础上改进而得到的,有学者称其为实 ...

  8. 【自适应盲均衡2】多径衰落信道的复数常模算法(CMA)的理论推导与MATLAB仿真

    关注公号[逆向通信猿]更精彩!!! 关于均衡的基础知识,首先可参考本人博客 LMMSE.Godard.CMA常模.Sato等算法在信道均衡中的应用理论与MATLAB仿真 理论推导 代价函数 J = E ...

  9. 计算机操作员理论知识试题,计算机操作员理论考试试题.doc

    计算机操作员理论考试试题 计算机操作员模拟题 多选题 1.关于冯.诺依曼体系结构,正确的是( BCD ) A.世界上第一台计算机就采用了冯.诺依曼体系结构 B.将指令和数据同时存放在内存中,是冯.诺依 ...

最新文章

  1. 最新数据显示,全国有580万人被限制乘坐高铁,大家怎么看?
  2. 随机森林RF、XGBoost、GBDT和LightGBM的原理和区别
  3. 怎么调节电机启动值_开关式智能充电机-全自动充电机-铅酸电池充电机品牌-济南能华...
  4. 一种结合实例和语义分割从田间图像中识别咖啡叶病虫害的深度学习方法
  5. 带返回值的函数如何在内部同步?
  6. 05 - Django应用第二步
  7. 1.1.15 word调整文字与下划线之间的间距
  8. 读取excel数据,根据word模板生成word文件。【python】【word vba】两种方法
  9. hsqldb mysql 语法_hsqldb快速入门
  10. Market Risk Modeling
  11. iOS开发实战细节——通知写法
  12. 高考读卡机是谁发明的?
  13. mysql输出当前是第几周使用week和weekofyear的区别
  14. 视频会议系统gk服务器,详解华为视频会议系统中信令之间如何实现跨GK呼叫
  15. 直流亥姆霍兹线圈和交流亥姆霍兹线圈的区别
  16. LeetCode题解(1276):不浪费原料的汉堡制作方案(Python)
  17. Java == equals() hashCoed()的区别
  18. 高压电压采样之差分放大电路
  19. mysql两表左关联_mysql中一张表LEFT JOIN 左关联两张表语句
  20. oracle ar 税率,AR发票问题--超急

热门文章

  1. 看电影的必备软件暴风影音使用小技巧儿
  2. 英语口语8000句 pdf_把这8000句英文对话反复听,反复跟读熟练,直到自己口语脱口而出...
  3. 爱是一种的需要,不一定要得到----《小娘惹》
  4. 设置Pycharm/IDEA背景颜色为护眼色
  5. NewLink能链IPO,能源物联网的先行者?
  6. 用链表实现大整数加法
  7. 怎样成为一个数据科学家:针对大学毕业生的指导
  8. 服务器高并发负载解决方案
  9. linux和windows sleep函数
  10. 进了国企以为上岸了!干了1年,我再次回到互联网内卷!