方差、标准差、均方误差和均方根误差
最近在整机器学习的内容,这个概念稍微有点乱,百度一下,里清楚了,做个记录:
一、白话描述
1、方差的二次开方等于标准差
2、均方误差的二次开方等于均方根误差。
3、方差是每个样本减去总样本的平均值去计算的,而均方误差是每个样本减去该样本的真实值来计算的
所以,方差、标准差是数学上的概念,而均方误差是在机器学习中用的比较多的概念,计算loss的时候会用,实际上原理是类似的,但是具体计算上稍微有些差别。这是我的理解(不一定正确),下面贴上一些具体的解释。
二、详细解释
一、百度百科上方差是这样定义的:
(variance)是在概率论和统计方差衡量随机变量或一组数据时离散程度的度量。概率论中方差用来度量随机变量和其数学期望(即均值)之间的偏离程度。统计中的方差(样本方差)是各个数据分别与其平均数之差的平方的和的平均数。在许多实际问题中,研究方差即偏离程度有着重要意义。
看这么一段文字可能有些绕,那就先从公式入手,
对于一组随机变量或者统计数据,其期望值我们由E(X)表示,即随机变量或统计数据的均值,
然后对各个数据与均值的差的平方求和,最后对它们再求期望值就得到了方差公式。
这个公式描述了随机变量或统计数据与均值的偏离程度。
二、方差与标准差之间的关系就比较简单了
根号里的内容就是我们刚提到的
那么问题来了,既然有了方差来描述变量与均值的偏离程度,那又搞出来个标准差干什么呢?
发现没有,方差与我们要处理的数据的量纲是不一致的,虽然能很好的描述数据与均值的偏离程度,但是处理结果是不符合我们的直观思维的。
举个例子:一个班级里有60个学生,平均成绩是70分,标准差是9,方差是81,成绩服从正态分布,那么我们通过方差不能直观的确定班级学生与均值到底偏离了多少分,通过标准差我们就很直观的得到学生成绩分布在[61,79]范围的概率为0.6826,即约等于下图中的34.2%*2
三、均方差、均方误差又是什么?
标准差(Standard Deviation) ,中文环境中又常称均方差,但不同于均方误差(mean squared error,均方误差是各数据偏离真实值的距离平方和的平均数,也即误差平方和的平均数,计算公式形式上接近方差,它的开方叫均方根误差,均方根误差才和标准差形式上接近),标准差是离均差平方和平均后的方根,用σ表示。标准差是方差的算术平方根。
从上面定义我们可以得到以下几点:
1、均方差就是标准差,标准差就是均方差
2、均方误差不同于均方误差
3、均方误差是各数据偏离真实值的距离平方和的平均数
举个例子:我们要测量房间里的温度,很遗憾我们的温度计精度不高,所以就需要测量5次,得到一组数据[x1,x2,x3,x4,x5],假设温度的真实值是x,数据与真实值的误差e=x-xi
那么均方误差MSE=
总的来说,均方差是数据序列与均值的关系,而均方误差是数据序列与真实值之间的关系,所以我们只需要搞清楚真实值和均值之间的关系就行了。
方差、标准差、均方误差和均方根误差相关推荐
- 方差、标准差(均方差),均方误差、均方根误差
方差(Variance).标准差(均方差,Standard Deviation),均方误差(MSE).均方根误差(RMSE) 其中,标准差是方差的平方根,均方根误差是均方误差的平方根 所以,这四个概念 ...
- 【误差】方差、标准差、均方误差和均方根误差的区别总结
文章目录 来源 方差 方差与标准差 均方差.均方误差.均方根误差 均方根值 来源 https://blog.csdn.net/zengxiantao1994/article/details/77855 ...
- 均值、方差、标准差、均方根、均方误差、均方根误差的区别与联系
均值.方差.标准差.均方根.均方误差.均方根误差的区别与联系 The mean, variance, and standard deviation are the most basic statist ...
- 方差、协方差、标准差、均方差、均方根值、均方误差、均方根误差对比分析
方差.协方差.标准差(标准偏差/均方差).均方误差.均方根误差(标准误差).均方根值 本文由博主经过查阅网上资料整理总结后编写,如存在错误或不恰当之处请留言以便更正,内容仅供大家参考学习. 方差(Va ...
- 方差、标准差、均方差、均方误差、均方根误差详细总结
方差.标准差.均方差.均方误差.均方根误差详细总结 看到网上别的大神总结的都是复制粘贴的,排版很凌乱,特此总结并精美排版一下. 方差 方差是衡量随机变量或一组数据时离散程度的度量.方差用来度量随机变量 ...
- 数学期望、方差、标准差、协方差、残差、均方差、均方误差、均方根误差、均方根值对比分析及python实现
内容较多,如有错误之处请评论区留言以便更正,内容仅供参考. 文章目录 期望(Expected value) 意义 定义 离散型 连续型 期望与平均值的区别 方差(Variance) 案例 概率论方差 ...
- MATLAB的var与std函数 与 均值,方差,标准差,均方差,均分误差
从定义上来讲,(样本)均值,方差,标准差,均方差,均分误差分别为: 均值: 方差: 标准差: 均方差=标准差 均方误差: matlab中的var函数和std函数用来计算方差 var函数计算使用的公式为 ...
- 统计学基础之:均值-中位数-众数-极差-中程数-方差-标准差-变异系数
转载自:http://blog.sina.com.cn/s/blog_62ded7bf0101aqba.html 本文大纲: 数据挖掘分析&算法前奏之data exploration做什么 基 ...
- 2.13 描述性统计(平均数,中位数,中数,数据的离散度(极差,平均绝对偏差,方差标准差))...
统计分析包括描述统计和推断统计两个部分. 对已有的数据整理,计算数据指标,平均数,中位数,中数,数据的离散度(极差,平均绝对偏差,方差标准差)是最常用的技术手段,也是最容易的. # hanbb # c ...
- 均值-中位数-众数-极差-中程数-方差-标准差-变异系数
一.数据挖掘&算法前奏之data exploration做什么 一个数字序列,如何通过简单的统计指标,直接&直观地描述这个数字序列的一些基本属性,是数据处理与理解的刚需.做数据挖掘和机 ...
最新文章
- 人工智能技术改变传统驾驶行为
- 杂题之循环移动字符串
- ActiveMQ;RabbitMQ;ZeroMQ
- nyist---组队赛(五)
- c++组合 聚合 关联
- 使用 Jackson 树连接线形状
- bootstrap登录表单
- 华为云mysql端口号_华为云云耀服务器远程连接mysql,报错10038端口配置问题。
- HttpInvoker-----客户端实现
- 30分钟彻底弄懂flex布局
- RabbitMQ入门(2)--工作队列
- android环境搭建—— 工欲善其事必先利其器
- 9.26-CSS 背景 字体 文本 边框 以及其他
- C#3.0学习(1)---隐含类型局部变量和扩展方法
- TeXworks 设置成默认用XeLaTeX排版
- Redis入门指南笔记
- 翁凯java进阶_多项式加法——mooc《零基础学Java语言》-(浙大翁凯)第五周编程题...
- PLC从业人员的发展方向
- stc12c5a60s MQ系列传感器及报警
- 北大的戴威,为何输给了三本的胡玮炜?
热门文章
- 微服务系列笔记之Mico Api详解
- 360°环视(全景影像)系统发展趋势
- 什么是Openflow?
- pytorch中torch.cholesky()函数的使用
- 深度学习——深度学习基础概念
- 访问项目无法访问 此网站192.168.*** 拒绝了我们的连接请求。
- 思科2018校园招聘硬件笔试试题 及其答案
- python设置刻度间隔不等_Matplotlib绘图遇到时间刻度就犯难?现在,一次性告诉你四种方法...
- mysql数据库物理结构_MySQL数据库结构设计(物理设计)
- cesium采用primitive方式加载geojson数据