1.标准误概念

标准误是数据统计的重点概念,且难以理解。百度上文章缺乏详细描述的文章。所以写下此文让读者能够彻彻底底了解标准误概念。

标准误全称:样本均值的标准误(Standard Error for the Sample Mean),顾名思义,标准误是用于衡量样本均值和总体均值的差距。

2.标准误意义:

用于衡量样本均值和总体均值的差距有多大?

标准误越小----样本均值和总体均值差距越小

标准误越大----样本均值和总体均值差距越大

标准误用于预测样本数据准确性 ,标准误越小,样本均值和总体均值差距越小,样本数据越能代表总体数据。

3.标准误与标准差区别:

对一个总体多次抽样,每次样本大小都为n,那么每个样本都有自己的平均值,这些平均值的标准差叫做标准误。

标准差是单次抽样得到的,用单次抽样得到的标准差可以估计多次抽样才能得到的标准误差

标准差表示数据离散程度:

标准差越大,分布越广,集中程度越差,均值代表性越差

标准差越小,分布集中在平均值附近,均值代表性更好

标准差与标准误不同应用范围:
标准差:(图左)在正负两个标准差(95%概率下),Jack消耗时间在68-132秒之间。
标准误:(图右)在正负两个标准误,Jack消耗平均时间大约在95-105秒之间。

4.标准误计算例子

什么是真实的标准误?举个例子,对一个总体12次抽样,生成12个样本,每个样本大小都为5。那么每个样本都有自己的平均值,这些平均值的标准差叫做标准误差。这里就是对表格最后一行数组计算标准差(100,101,99,114,103.....93),最后算出来标准误结果为6.33。

但是为了得到标准误,我们不可能做很多次科学实验。实际上我们可以做一次样本实验,然后采用估算公式:

如下图,我们用第一组样本估算真实标准误,此样本标准差除以根号n,结果为7.16, 然后把7.16约等为真实的标准误6.33。

所以标准误也是另外一种形式的标准差,标准误和总体标准差既有相似处,又有区别。标准误是一个比较难得概念,读者一次不能很好理解,如果反复看此文章,然后自己动手程序模拟,就会增强直观印象,加深理解。

所有的随机样本中,如果数量相同,它们的标准误默认为近似相同(非真正相同)

5.标准误的应用
我们有两组数据,一组观看了指导视频,一组没有观看指导视频,比较两组数据在得分方面有无显著差异?

随着样本量不同,我们得到的结果不同。图左,两组数据没有区别,图中两组数据可能有区别,可能没有;图右两组数据有区别
样本量为3时,看视频组的2*标准误为15,没看视频的2*标准误为13。

样本量小时,标准误很大,样本均值和总体均值差异很大,样本数据的代表性很差。

样本量为5时,看视频组的2*标准误为9,没看视频的2*标准误为10。

样本量增大后,标准误变小。

样本量为10时,看视频组的2*标准误为7,没看视频的2*标准误为6。
样本量增大后,标准误再次变小

随着样本量不同,我们得到的结果不同。下面的图左(样本量为3),两组数据没有区别,图中(样本量为5)两组数据可能有区别,可能没有;图右(样本量为10)两组数据有区别
实际上,众多毕业论文和专业期刊的统计分析都是错的,虽有华丽的可视化图表,但新手很容易因样本量太小得到错误结果。

6.蒙特卡洛模拟

蒙特卡洛验证,对一组样本进行标准误评估,看公式SE = s/√(n)是否准确

结果表明SE = s/√(n)公式得到的标准误和真实标准误非常接近

样本值100,标准误很小,大约0.1

样本值10,标准误增大,大约0.33

样本值5,标准误再次增大,大约0.45

源代码如下

#微信公众号:pythonEducation# -*- coding: utf-8 -*-import random,mathimport numpy as npn=1000normal_population=list(np.random.normal(size=n))mean_population=np.mean(normal_population)#总体标准差sigma=np.std(normal_population,ddof=0)#存放多个随机样本list_samples=[]#多个随机样本的平均数list_samplesMean=[]#求单个样本估算的标准误def Standard_error(sample):std=np.std(sample,ddof=0)standard_error=std/math.sqrt(len(sample))return standard_error#求真实标准误def Standard_error_real():for i in range(100):sample=random.sample(normal_population,100)list_samples.append(sample)list_samplesMean=[np.mean(i) for i in list_samples]standard_error_real=np.std(list_samplesMean,ddof=0)return standard_error_real #plt.hist(normal_values)#真实标准误standard_error_real=Standard_error_real()print(standard_error_real)#随机抽样print(Standard_error(list_samples[0]))print(Standard_error(list_samples[1]))print(Standard_error(list_samples[2]))

欢迎各位学习更多数据分析知识(博主录制)

欢迎各位同学学习我录制的更多相关知识从0到1Python数据科学之旅 :https://edu.csdn.net/combo/detail/1929

标准误(Standard Error)相关推荐

  1. python standardprint_标准误(Standard Error)

    1.标准误概念 标准误是数据统计的重点概念,且难以理解.百度上文章缺乏详细描述的文章.所以写下此文让读者能够彻彻底底了解标准误概念. 标准误全称:样本均值的标准误(Standard Error for ...

  2. 测量标准误(Standard Error of Measurement;SEm)

    目 录 1. 测量标准误的意义 2. 测量标准误的计算方法 3. SEmSEmSEm的置信区间 4. 统计显著和实际显著 5. 参考文献 1. 测量标准误的意义 举例:分数不能代表一切,也就是说分数不 ...

  3. 标准差(standard deviation)和标准错误(standard error)你能解释一下?

    by:ysuncn(欢迎转载,转载请注明原始消息) 什么是标准差(standard deviation)呢?依据国际标准化组织(ISO)的定义:标准差σ是方差σ2的正平方根.而方差是随机变量期望的二次 ...

  4. R语言回归模型残差标准误差计算实战(Residual Standard Error):计算残差标准误、残差标准误解读

    R语言回归模型残差标准误差计算实战(Residual Standard Error):计算残差标准误.残差标准误解读 目录

  5. 标准差(Standard Deviation), 标准误差(Standard error),变异系数 (Coefficient of Variance )的区别与联系

     标准差(Standard Deviation) ,中文环境中又常称均方差,是离均差平方的算术平均数的平方根,用σ表示.标准差是方差的算术平方根.标准差能反映一个数据集的离散程度.平均数相同的两组数据 ...

  6. R语言计算平均值的标准误差(standard error of the mean):自定义函数计算平均值的标准误差、使用plotrix包的std.error函数计算平均值的标准误差

    R语言计算平均值的标准误差(standard error of the mean):自定义函数计算平均值的标准误差.使用plotrix包的std.error函数计算平均值的标准误差 目录

  7. 均值估计标准差(Standard Deviation) 和 标准误差(Standard Error)

    最近一直在研究均值估计之类的问题,下午正好有机会和大家分享一下. 本文摘自 Streiner DL.Maintaining standards: differences between the sta ...

  8. 对于随机变量的标准差standard deviation、样本标准差sample standard deviation、标准误差standard error的解释...

    参考:http://blog.csdn.net/ysuncn/article/details/1749729

  9. 标准差与标准误的区别(标准误也称标准误差)

    1.标准差是对一次抽样的原始数据进行计算的,而标准误则是对多次抽样的样本统计量进行计算的(这个统计量可以是均值): 2.标准差只是一个描述性指标,只是描述原始数据的波动情况,而标准误是跟统计推断有关的 ...

  10. 【笔记】因子投资:方法与实践

    文章目录 历史 宏观综述 研究角度 关于β'λ 关于α 截面角度vs时序角度 学术理论 基础概念 金融理论 MM定理 资产定价模型 多因子模型 研究方法论 投资组合排序法 排序 检验 多重排序法 多因 ...

最新文章

  1. ecs服务器配置git_阿里云 ECS服务器(CentOS 7)安装和使用Gitlab教程
  2. php 和mysql实现抢购功能_php处理抢购类功能的高并发请求
  3. 前端学习(3142):react-hello-react之父组件render
  4. JavaScript中Object.keys、Object.getOwnPropertyNames区别
  5. mysql 查看索引命中_请问下如何在Mysql中where与orderBy后在命中索引?
  6. 用matlab辨识系统,Matlab系统辨识工具箱
  7. 掌握这些插件,分分钟提高你的办公效率90%!
  8. 简述SD卡的工作原理(四)
  9. Coursera视频无法播放问题解决
  10. fatal error LNK1120: 1 个无法解析的外部命令 的解决办法
  11. nw.js文件上传到服务器,用nw.js构建node项目
  12. 计算机组成原理 汇编语言
  13. 压缩比13为什么建议用92的油_马自达为啥能在13:1高压缩比下仍然使用92汽油
  14. linux文件赋予用户权限,Linux 给用户赋予操作权限
  15. 我的一个朋友想在这发自我介绍?!
  16. Facebook Libra 内存池组件(Mempool)简介
  17. 【2022最新Java面试宝典】—— Java并发编程面试题(123道含答案)
  18. 可以吗?从 FireWire 设备引导 Linux
  19. Mysql数据库给用户添加权限
  20. 开发API接口的安全验证:token,参数签名,时间戳

热门文章

  1. 【重温经典】《谁谋杀了我们的游戏?》出自《黑神·话悟空》制作人Yocar
  2. android 日期转星座,日期匹配星座,月日匹配星座,android 星座
  3. compare的数组升序和降序
  4. OPENGL中GLAD的代码实现过程
  5. KU FPGA DDR4 SDRAM仿真/板卡测试
  6. 安装pytorch1.10.0/cu111时报错:no matching distribution found for torchvision==0.11.0+cu111
  7. Python爬取热映电影,以『可视化及词云秀』方式带你了解热映电影
  8. 转:SDHC卡驱动及初始化
  9. python爬取“堆糖网”小姐姐 图片
  10. 2018-2019年江苏省高等学校“阿里云大数据技术实战训练营”大学生万人计划学术冬令营开营...