标准差分母是n和n-1的区别(有偏估计与无偏估计)
中学时学习的标准差定义为
s=[(x1−x)2+(x2−x)2+......(xn−x)2]/ns=\sqrt{[(x_1-x)^2+(x_2-x)^2+......(x_n-x)^2]/n}s=[(x1−x)2+(x2−x)2+......(xn−x)2]/n
某些统计类的书籍提到上面是样本的有偏估计,而无偏估计的标准差定义为
s=[(x1−x)2+(x2−x)2+......(xn−x)2]/(n−1)s=\sqrt{[(x_1-x)^2+(x_2-x)^2+......(x_n-x)^2]/(n-1)}s=[(x1−x)2+(x2−x)2+......(xn−x)2]/(n−1)
其中分母是n,因为这里的n的意义是总体数量。而在实际统计中,往往以样本代替反映整体,这时要用的就是你问的(n-1),表示的是样本能自由选择的程度(当选到只剩一个时,它不可能再有自由了,所以自由度是n-1)。具体什么时候用哪个做分母,原则如下:
如是总体,标准差公式根号内除以n
如是样本,标准差公式根号内除以(n-1)
因为我们大量接触的是样本,所以普遍使用根号内除以(n-1)
其实可以这么看,我们统计标准差是为了计算总体或样本的波动性。如果只有一个样本,有偏估计算出来的s为0,无偏估计算出来的s为1(也就是没有波动);样本数为2的时候,有偏估计s把两个样本的差距还除了个2,而无偏估计s就是两个样本的差距,可以看出研究样本的时候无偏估计的计算结果更符合直觉。
再换一个角度想一下,2个样本的时候,他们的差距就是波动性,不需要再除以2;
3个样本也是第一个样本和后面两个样本的差距代表波动性,只比了2次所以是除以2而不是除以3;
n个样本也是某一个样本和其他n-1个样本比,比了n-1次而不是n次,所以除以n-1。
标准差分母是n和n-1的区别(有偏估计与无偏估计)相关推荐
- 计算标准差分母是n还是n-1?
概述 提问:在我们计算某些数据标准差(或者方差)的时候,会发现有些公式分母是n,而有些公式的分母却是(n-1),那么到底哪个公式才是正确的呢? 答案: 如果是算总体的标准偏差,分母就用n,这就是真实的 ...
- 均值、方差、标准差、均方根、均方误差、均方根误差的区别与联系
均值.方差.标准差.均方根.均方误差.均方根误差的区别与联系 The mean, variance, and standard deviation are the most basic statist ...
- 方差、标准差、均方差、均方误差(MSE)区别总结
一.方差 在概率论和统计方差是衡量随机变量或一组数据时离散程度的度量.概率论中方差用来度量随机变量和其数学期望(即均值)之间的偏离程度.统计中的方差(样本方差)是各个样本数据和平均数之差的 平方和 的 ...
- 【20180128】【matlab】均值、标准差、方差、协方差、中值的求解
求均值: 向量 行向量A:mean(A) A = [1,2,3,4,5]; mean(A)ans =3 列向量A:mean(A) B = [0,3,1,0,6]'; mean(B)ans =2 矩阵- ...
- 方差、协方差、标准差、均方差、均方根值、均方误差、均方根
转载自https://blog.csdn.net/cqfdcw/article/details/78173839 方差(Variance) 方差用于衡量随机变量或一组数据的离散程度,方差在在统计描述和 ...
- 标准差,协方差与相关系数
学过概率统计的孩子都知道,统计里最基本的概念就是样本的均值,方差,或者再加个标准差.首先我们给你一个含有n个样本的集合,依次给出这些概念的公式描述,这些高中学过数学的孩子都应该知道吧,一带而过. 很显 ...
- 方差、协方差、标准差、均方差、均方根值、均方误差、均方根误差对比分析
方差.协方差.标准差(标准偏差/均方差).均方误差.均方根误差(标准误差).均方根值 本文由博主经过查阅网上资料整理总结后编写,如存在错误或不恰当之处请留言以便更正,内容仅供大家参考学习. 方差(Va ...
- 方差、协方差、标准差、均方差、均方根值、均方误差、均方根误差
方差(Variance) 方差用于衡量随机变量或一组数据的离散程度,方差在在统计描述和概率分布中有不同的定义和计算公式.①概率论中方差用来度量随机变量和其数学期望(即均值)之间的偏离程度:②统计中的方 ...
- python not in range1002无标题_Python中偶尔遇到的细节疑问(一):去除列名特殊字符、标准差出现nan、切片索引可超出范围、range步长、众数...
1. Pandas读取csv或excel数据时,很可能遇到的columns中,列名会带有特殊字符,例如:空格. ..双空格.引号等等,如果不想手动修改的话,可以df.rename()来解决. df = ...
最新文章
- VC代码的编写和调试---编写易于调试的VC代码
- Dapr + .NET 实战(四)发布和订阅
- .net持续集成测试篇之Nunit文件断言、字符串断言及集合断言
- kafka监控工具kafkaOffsetMoniter的使用
- SpringCloud高频重点面试题,看这一篇就够了。
- 第7章 聚类分析及R使用
- vscode运行vue时,显示loader. js SyntaxError: Unexpected identifier
- 背包问题:从给定的无序、不重复的数组 A 中,取出N个数,使其相加和为M
- SDK中利用COM打印helloworld时报错DONE pin is not high on target FPGA的一种可能的解决办法
- 2014/08/11 – Backbonejs
- Oracle 12C -- native left outer join的加强
- 带ant 的收发器_ANT无线收发器nRF24AP1及其应用
- LeetCode 343. 整数拆分(Integer Break) 25
- 四个好看的table表格样式
- 基于Windows 7环境的WAPI无线网络应用层控制实现
- EvoSuite生成单元测试用例
- 建模与仿真matlab论文,基于matlab风力发电系统的建模与仿真毕业设计论文
- python-吃豆子游戏
- 迅为-4418开发板-驱动-PWM输出实验
- 市场营销工作重中之重——提升工作效率