箱形图适用于哪种数据_python数据分布型图表箱形图系列带误差线箱形图
箱形图系列
箱形图(box plot)也称箱须图(box-whisker plot)、箱线图、盒图
显示一组数据的最大值、最小值、中位数、及上下四分位数;
用来反映一组或多组连续型定量数据分布的中心位置和散步范围;
从盒子两端延伸出来的线条称为“晶须”(whisker);
用来表示上下四分位数以外的变量;
异常值(outlier)
有时会以与晶须处于同一水平的单一数据点表示;
四分位数(quartile)
在统计学中把所有数值由小到大排列并分成四等份;处于三个分割点位置的数值;
分位数
将总体的全部数据按大小顺序排列后,处于各等分位置的变量值;
中位数
如果将全部数据分成相等的两部分;
四分位数
如果分成四等分;也称为四分位点;将全部数据分成相等的四部分,其中每部分包括25%的数据,处于各分位点的数值;四分位数有三个
第一个四分位数---下四分位数;
也称为“较小四分位”,等于该样本中所有数值由小到大排列后第25%的数字;
第二个四分位数---中位数
也称为“中位数”,等于该样本中所有数值由小到大排列后第50%的数字;
第三个四分位数---上四分位数;
也称为“较大四分位数”,等于该样本中所有数值由小到大排列后第75%数字;第三个四分位数与第一个四分位数的差距又称为四分位距(InterQuartile Range,IQR);
箱形图通常用于描述性统计
直观明了地识别批量数据中的异常值;
利用箱型图判断批量数据的偏态和尾重;
箱型图系列绘制方法
plotnine包中的geom_boxplot()函数可以绘制箱型图;
再使用geom_jitter()函数绘制抖动散点图;
绘制带误差线的箱形图
import pandas as pd
import numpy as np
import seaborn as sns
import matplotlib.pyplot as plt
from plotnine import *
df=pd.read_csv('d:\python\out\DistributionD.csv')
df['class']=df['class'].astype("category", ["n", "s", "k", "mm"])
#带误差线的箱型图
box_plot=(ggplot(df,aes(x='class',y="value",fill="class"))
+geom_boxplot(show_legend=False)
+scale_fill_hue(s = 0.90, l = 0.65, h=0.0417,color_space='husl')
+theme_matplotlib()
+theme(aspect_ratio =1.05,
dpi=100,
figure_size=(4,4)))
print(box_plot)
box_plot.save("box_plot.pdf")
绘制箱型与抖动散点组合图
import pandas as pd
import numpy as np
import seaborn as sns
import matplotlib.pyplot as plt
from plotnine import *
df=pd.read_csv('d:\python\out\DistributionD.csv')
df['class']=df['class'].astype("category",["n", "s", "k", "mm"])
#箱型与抖动散点组合图
box_plot1=(ggplot(df,aes(x='class',y="value",fill="class"))
+geom_boxplot(show_legend=False)
+geom_jitter(fill="black",shape=".",width=0.3,size=3,stroke=0.1,show_legend=False)
+scale_fill_hue(s = 0.90, l = 0.65, h=0.0417,color_space='husl')
+theme_matplotlib()
+theme(aspect_ratio =1.05,
dpi=100,
figure_size=(4,4)))
print(box_plot1)
box_plot.save("box_plot2.pdf")
箱形图适用于哪种数据_python数据分布型图表箱形图系列带误差线箱形图相关推荐
- python 分布图_python数据分布型图表柱形分布图系列带误差线的柱形图
柱形分布图系列 柱形分布图系列 使用柱形图的方式展示数据的分布规律: 可以借助误差线或散点图: 带误差线的柱形图就是使用每个类别的均值作为柱形的高度: 再根据每个类别的标准差绘制误差线: 缺点:无法显 ...
- matlab 条形图误差线,数据可视化系列:手把手教你绘制带误差线的条形图
原标题:数据可视化系列:手把手教你绘制带误差线的条形图 条形图可以用于展示数据不同分类下的均值.中位数.标准差和置信区间等,Excel可以实现,但对于带误差线的条形图而言,还是比较麻烦的.R语言的基础 ...
- 箱形图适用于哪种数据_Python数据分析之Seaborn(分类分析绘图 )
Seaborn分类分析绘图 %matplotlib inlineimport numpy as npimport pandas as pdimport matplotlib as mplimport ...
- 箱形图适用于哪种数据_盘点 | 十分钟进阶Excel数据可视化
过·往 半年前,开了一个叫"知识点"的小专题,陆陆续续分享了一些数据可视化相关的东西.其中Excel相关16篇,Tableau相关3篇,Ai相关3篇,D3.js相关2篇. 刚开始的 ...
- python分析股票数据_Python数据可视化——股票数据分析
1.背景 GAFATA,它表示的是GOOGLE,AMAZON,FACEBOOK,APPLE,TENCENT,ALIBABA这六家互联网巨头的首字母缩写.本文主要分析GAFATA这六家公司股票近一年的的 ...
- matplotlib柱状图上方显示数据_Python数据可视化之matplotlib
数据可视化能让人们更直观的传递数据所要表达的信息.Python 中有两个专用于可视化的库,matplotlib 和 seaborn ,本文将介绍matplotlib. Matplotlib:基于Pyt ...
- python统计excel中重复数据_Python中用pandas对标Excel自带功能——去除重复项
经常听别人说 Python 在数据领域有多厉害,结果学了很长时间,连数据处理都麻烦得要死.后来才发现,原来不是 Python 数据处理厉害,而是他有数据分析神器-- pandas 前言 有时候数据中出 ...
- ggplot:截断坐标轴的折线图(带误差线)
library("ggplot2") library("ggbreak") library(RColorBrewer)# 主题 ---------------- ...
- js 处理十万条数据_Python数据可视化2018:为什么这么多的库?
在奥斯汀举行的SciPy2018特别会议上,许多开源Python可视化工具的代表分享了他们对于Python数据可视化未来发展的不同观点.我们听到了关于Matplotlib,Plotly以及VisPy等 ...
- python归档excel数据_python 数据存储excel
Python的小数据存储,用什么格式更有逼格? 小数据存储 我们在编写代码的时候,经常会涉及到数据存储的情况,如果是爬虫得到的大数据,我们会选择使用数据库,或者excel存储.但如果只是一些小数据,或 ...
最新文章
- mysql 打印_故障分析 | MySQL:5.6大事务show engine innodb status故障一例
- 20155226 2016-2017-2 《Java程序设计》第一周学习总结
- ACM题解系列之一:刘汝佳:《算法竞赛入门经典》(第2版)
- python字符串反转方法_Python程序使用堆栈和反转方法反转字符串
- MySQL进阶之索引
- vs 如何将源文件转换成可执行文件_如何将图片文件转换成PDF文件?
- 【离散数学】单向连通和弱连通的区别
- Oracle GoldenGate理论
- git 常用命令及虚拟机服务器仓库搭建
- C++基础教程,基本的输入输出
- HTMLCSS 第五天 笔记
- BZOJ2160 拉拉队排练
- AVOD:点云数据与BEV图的处理及可视化
- 下载 Flash Player 强制跳转至 flash.cn,无法下载国际版 Flash 解决方法
- 新百家姓前20位(附前300名)
- Hive实现同比环比计算
- php cms 301,www域名301
- GIS软件——arcgis10.2制作符号并链接符号库
- java斗地主发牌_实现斗地主发牌(java)
- java英雄国度加速版_谷得游戏 - 评价 | TapTap 发现好游戏
热门文章
- 笔迹心理学(2): 功能设计
- macOS 虚拟摄像头:CamTwist for Mac
- Pollard Rho 质因数分解
- vue-print 实现打印功能
- 软考高级 真题 2016年下半年 信息系统项目管理师 案例分析
- IP地址 网关是什么?网络概念
- 数据结构课程设计:17、售票处的服务系统(***)
- blob/text column 'content' used in key specification without a key length
- DWT(离散小波变换)
- c 语言查询条件并列怎么用,关于C# if语句中并列条件的执行