统计之均值中位数众数全距四分位数以及箱线图展示
均值:即平均数,数列中各数总和除以个数。可用numpy.mean函数计算
中位数: 数字从小到大排列的数列中位于中间位置的那个数,如果数列个数为奇数位则中位数位于(n+1)/2, 如果为偶数位则为n/2与n/2+1的两个数的平均值,可以用numpy.median函数计算
众数:数列中出现频率最多的数, 可以用scipy的stats.mode函数计算
全距:数列中最大值与最小值的差
四分位数:将从小到大排列的数列平均分为4段,最小的四分位数称为下四分位数,最大的成为上四分位数,中间的称为中位数
可以用箱线图展示以上数据(仍以维他命价格为例,数据下载地址)
图形如下
左侧为价格的散点图
右侧为箱线图,其中
- min为价格的最小值
- max为价格的最大值
- q1是第一四分位数(下四分位数)即位于25%位值的数
- median为中位数
- q3为第三四分位数(上四分位数)也即位于第75%的数,说明50%的价格集中在¥38.9与¥120.45之间
- upper fence为上限=Q3+1.5IQR,四分位距IQR=Q3-Q1,也就是Q3向上延伸1.5倍IQR的数据点,超出范围则为最大值
- 下限=Q1-1.5IQR,Q1向下延伸1.5倍IQR距的数据点,超出范围则为最小价格值
代码如下:
tbdata = pd.read_csv("tb_vitamin_20200925.csv")p_median = np.median(tbdata["price"]) # 中位数p_mean = np.mean(tbdata["price"]) # 均值p = stats.mode(tbdata["price"])p_argmax = p[0][0] # 众数, p[1][0]返回众数出现的频率fig = go.Figure()fig.add_trace(go.Box(y=tbdata["price"],boxpoints="all", # 显示所有数据点jitter=0.3, # 散点的分散程度pointpos=-1.8, # 散点与box的位置【-2,2】name="箱线图"))fig.show()
统计之均值中位数众数全距四分位数以及箱线图展示相关推荐
- 不会数学统计没关系——5分钟教你轻松掌握箱线图 | 图表家族#24
转载:https://www.sohu.com/a/218322591_416207 箱线图也称箱须图.箱形图.盒图,用于反映一组或多组连续型定量数据分布的中心位置和散布范围.箱形图包含数学统计量,不 ...
- 数学-统计-距-四分位数、箱线图、方差、标准差、标准分(Z分布)
上下四分位数
- 【读书笔记->统计学】03-01 各种“距”和“差”-极差(全距)、四分位距(数)、百分位数、箱线图概念简介
各种"距"和"差" 上一章中我们学习了平均数,但是它有自己的有限性.为了得到更多的信息,我们开始学习各种"距"和"差". ...
- 统计学基础之:均值-中位数-众数-极差-中程数-方差-标准差-变异系数
转载自:http://blog.sina.com.cn/s/blog_62ded7bf0101aqba.html 本文大纲: 数据挖掘分析&算法前奏之data exploration做什么 基 ...
- 均值-中位数-众数-极差-中程数-方差-标准差-变异系数
一.数据挖掘&算法前奏之data exploration做什么 一个数字序列,如何通过简单的统计指标,直接&直观地描述这个数字序列的一些基本属性,是数据处理与理解的刚需.做数据挖掘和机 ...
- matplotlib 均值_matplotlib可视化箱线图
前言针对离散变量我们可以使用常见的条形图和饼图完成数据的可视化工作,那么,针对数值型变量,我们也有很多可视化的方法,例如箱线图.直方图.折线图.面积图.散点图等等.先来数值型变量的箱线图绘制.箱线图一 ...
- 宏基因组扩增子3统计绘图:中文首发,最详系,零基础(箱线图、散点图、热图、曼哈顿图、火山图、韦恩图、三元图、网络图)
本网内容首发"宏基因组"公众号,更佳阅读体验.更多相关文章,欢迎点我跳转至公众号阅读 注:文为蓝色字均为文章链接,可点击直达 写在前面 优秀的作品都有三部分曲,如骇客帝国.教父.指 ...
- 扩增子统计绘图1箱线图:Alpha多样性
本网对Markdown排版支持较差,对格式不满意的用户请跳转至 或"宏基因组"公众号阅读: 写在前面 优秀的作品都有三部分曲,如骇客帝国.教父.指环王等. 扩增子系列课程也分为三部 ...
- 数据为北太平洋柔鱼两年(1,2)的生物学采样数据,根据此数据完成 (1) 按年描述柔鱼的体重和胴长数据(如均值,方差,级差,分位数等),并进行绘 制(如直方图、箱线图,密度图等)。
三.数据为北太平洋柔鱼两年(1,2)的生物学采样数据,根据此数据完成 (1) 按年描述柔鱼的体重和胴长数据(如均值,方差,级差,分位数等),并进行绘 制(如直方图.箱线图,密度图等). library ...
最新文章
- Altium Desgner软件,PCB设计中铺铜的作用
- [C++] vector 定义和初始化
- OpenStack-MitakaCentos7.2双节点搭建--(六)Dashboard服务
- python字典里存字符_Python字典和字符串的学习
- 漫扯:从polling到Websocket(ZZ)
- 抽象工厂模式设计模式_21世纪的设计模式:抽象工厂模式
- python函数控制词典_Python 基础之集合相关操作与函数和字典相关函数
- 手写分页 个人感觉还能优化,甚至抽象出来,需要高手讲解
- Yam Finance和UMA合作推出Degenerative Finance
- verilog coding style_阿里云收购长亭科技后 腾讯云也完成了对CODING的收购
- 西安工程大学计算机是几本专业,2016年西安工程大学计算机科学与技术(卓越班)专业在陕西录取分数线...
- Linux课程第二十四天学习笔记
- 颜宁谈为何选择深圳:一拍即合!我麻溜地向普林斯顿递了辞职申请
- 百度离线地图-加载地图(一)
- 小猿圈:web前端工程师工资有多高?
- Moviepy音视频剪辑:视频添加雪花飘落特效
- 【图片新闻】俄罗斯水下核武器“海啸天启鱼雷”探秘
- Linux入坑手册(鸟哥的私房菜)
- 叫谁修猫呢?叫蓝总|ONES 人物
- 工作组与域网络的特点与区别(下)
热门文章
- luogu P5286 [HNOI2019]鱼
- C++-源代码调试-Visual Studio-X64dbg-WinDbg-插件开发
- Kali Linux简介
- NAS信令学习笔记 ——GUTI
- html5动态连线,canvas简单连线动画的实现代码
- w10更新后怎么找计算机全民,Win10系统下全民WiFi不能用了怎么办
- 人工智能时代,数据标注产业将迎来黄金时期?丨曼孚科技
- APP+后台+vue前端全套打包送,电商解决方案CRMEB开源啦
- Bandizip Archiver for mac(便捷解压缩软件)
- Oracle的学习心得和知识总结(七)|Oracle数据库Literals技术详解