统计学基础1:描述性统计(数据的离散度、极差、方差、标准差)
python 统计学基础1:描述性统计
- 一、频数
- 二、数据的位置(平均数、中位数、众数、百分位数)
- 三、数据的离散度(极差、偏差、方差、标准差)
- 3.1、极差(Range)
- 3.2 、平均绝对偏差(Mean Absolute Deviation)
- 3.3方差(Variance)和标准方差(Standard Deviation)
- 一、概率与概率分布
- 1、概率是用来刻画事物不确定性的一种测度,根据概率的大小,我们可以判断不确定性的高低。概率取值介于 0 和 1 之间。
一、频数
1、频数:一组定量数据中,每一个数值发生的次数即为频数。
2、频率:将每一个数值发生的次数除以样本总数量,即频率
二、数据的位置(平均数、中位数、众数、百分位数)
data 在下面代表样本数据集-----------------------------------------------------
2.1、求平均数:(Sample Mena)
data.mean()
2.2、求中位数(Median):即使样本中至少50%的数据大于等于md,同时至少50%的数据小于等于md,它是一个很好的度量数据中心位置的方法。
data.median()
2.3、众数(Mode): 众数是一组数据中出现次数最多的数值,也是常见的度量数据中心位置的指标。同中位数一样,众数不易受极端值的影响。
data.mode()
2.4、百分位数: 第n百分分位数即为使得至少(100-n)%的观测值大于等于该数、至少n%的观测值小于等于该数的一个数值。通常将第25百分位数与中位数、第75百分位数取出来组成四分位数,分别叫做第一四分位数(或下四分位数),第二四分位数、第三四分位数(或上四分位数)。
求上四分位数和下四分位数:quantile( )
data.quantile(i) for i in [0.25, 0.75]
三、数据的离散度(极差、偏差、方差、标准差)
3.1、极差(Range)
一个数据集中最大值与最小值之差,即为极差。公示为:
极差 = 最大值 -最小值 : data.max() - data.min()
3.2 、平均绝对偏差(Mean Absolute Deviation)
数据的离散度还可以通过一组数据中数据与均值的偏差来度量。一个数据与均值的差值越大,说明该数据偏离均值越远。但是所有数据的差值加总起来和为零,所以离散度无法用其和来度量。但数据与均值的差值之绝对值也可以衡量整体的离散程度
求平均绝对偏差: data.mad()
3.3方差(Variance)和标准方差(Standard Deviation)
除了对数据与均值的差取绝对值以外,方差即是根据数据与均值偏差的平方算出的用于衡量数据离散度的指标,而标准差是偏差的平方根。这2种指标是我们在实务中最常用的衡量数据离散度的指标。
求方差:data.var()
求标准差:data.std()
python 统计学基础2:随机变量简介---------------------------------------------
一、概率与概率分布
1、概率是用来刻画事物不确定性的一种测度,根据概率的大小,我们可以判断不确定性的高低。概率取值介于 0 和 1 之间。
统计学基础1:描述性统计(数据的离散度、极差、方差、标准差)相关推荐
- 统计学基础_13描述性统计
1. 书籍和文中所提到的数据会在文末提供百度云下载,所有数据都不会有加密,可以放心下载使用 2. 文中计算的结果与书中不同是由于数据使用的时间段不同 目录 1. 准备数据 2. 绘制频数直方图 3. ...
- 【T】大数据统计学基础:描述性统计
引入:统计学是应用,数理统计是其理论基础. 数据的集中趋势程度 平均数:平均水平 中位数:中等水平 众数:一般水平 数据的离散程度 方差:数据离中心(平均数)越远越离散 标准差:避免单位平方引起的度量 ...
- pandas基础(part3)--描述性统计
学习笔记,这个笔记以例子为主. 开发工具:Spyder 文章目录 numpy描述性统计 Pandas描述性统计 numpy描述性统计 数值型数据的描述性统计,主要包括了计算数值型数据的完整情况.最小值 ...
- 统计学基础(三)—数据的概率分布与差异检验方法
1 四种数: 平均值:看某一组数据的平均情况(注:平均数对异常值的敏感程度太低,其结果往往很有争议) 四分位数:用来比较不同类别数据的整体情况:通过箱线图可以用来检验出异常值 标准差:用来衡量数据的波 ...
- 机器学习数学基础:数理统计与描述性统计
↑↑↑关注后"星标"Datawhale 每日干货 & 每月组队学习,不错过 Datawhale干货 作者:吴忠强,Datawhale优秀学习者 所谓机器学习和深度学习, ...
- [转载] python查看的统计量_python 描述性统计_Python中的基本统计:描述性统计
参考链接: Python中的统计函数 1(中位数和平均值的度量) python 描述性统计 The field of statistics is often misunderstood, but it ...
- python 描述性统计_Python中的基本统计:描述性统计
python 描述性统计 The field of statistics is often misunderstood, but it plays an essential role in our e ...
- 用Python玩转统计数据:取样、计算相关性、拆分训练模型和测试
导读:本文会介绍一些技术,帮你更好地理解数据,以及探索特征之间的关系. 本文使用Python建立对数据的理解.我们会分析变量的分布,捋清特征之间的关系.最后,你会学习给样本分层,并将数据集拆分成测试集 ...
- 统计学基础之:均值-中位数-众数-极差-中程数-方差-标准差-变异系数
转载自:http://blog.sina.com.cn/s/blog_62ded7bf0101aqba.html 本文大纲: 数据挖掘分析&算法前奏之data exploration做什么 基 ...
- 概率统计——数理统计与描述性统计
概率是用计算概括的常识 . \textbf{概率是用计算概括的常识}. 概率是用计算概括的常识.--拉普拉斯 数理统计 以下这些概念,你品,你细品~ 名词 符号 概念 总体 X X X 研究对象的全体 ...
最新文章
- LLVM Backend技术
- python梦幻西游4小人_梦幻西游大漠插件过鼠标漂移和四小人
- centos7安装mysql缺失依赖_CentOS7安装mysql5.7不成功,解决依赖包之后还是无法安装成功...
- 论网站更新与seo优化的关系
- u2net encode
- 冒泡排序的多种写法、逻辑
- 浅析数据库case when 用法
- java接口自动化(四) - 企业级代码管理工具Git的应用
- ServletContextListener 的应用
- hadoop配置集群的心得
- 3D线激光成像数学模型简析
- Theano介绍及简单应用
- oracle获取中位数
- JAVA 使用DateUtils对日期进行格式转换
- rk3399 android 9.0 skype强制切换到前置摄像头
- 【Django | 安全防护】CSRF跨站伪请求和SQL注入攻击
- 阿里云有奖调查结果公布,赠送10个阿里巴巴logo胸针
- 媒体播控系统、信息发布系统 使用说明
- pip升级报错:def read(rel_path: str) -> str SyntaxError: invalid syntax
- 便利店新零售怎么做,才能实现销售额倍增?
热门文章
- Word文件丢失如何找回?丢失数据这样恢复
- JS 数组扁平化 (递归写法)
- Trimble RealWorks处理点云数据(三)之点云抽稀取样
- Sharding-JDBC 源码分析 —— SQL 改写
- 计算机毕业设计ssm基于web的暗香小店系统的设计与实现80041系统+程序+源码+lw+远程部署
- 二零零七年五一节自驾游记(十一)--------0501若尔盖花湖III
- 超强牛人语录50条,经典中的经典
- 基于NodeJS的视频网站爬虫工具
- HiFormer Hierarchical Multi-scale Representations Using Transformers for Medical Image Segmentation
- 初中学历可以报考成人大专吗?