箱形图系列

箱形图(box plot)也称箱须图(box-whisker plot)、箱线图、盒图

  • 显示一组数据的最大值、最小值、中位数、及上下四分位数;

  • 用来反映一组或多组连续型定量数据分布的中心位置和散步范围;

  • 从盒子两端延伸出来的线条称为“晶须”(whisker);

  • 用来表示上下四分位数以外的变量;

异常值(outlier)

有时会以与晶须处于同一水平的单一数据点表示;

四分位数(quartile)

在统计学中把所有数值由小到大排列并分成四等份;处于三个分割点位置的数值;

分位数

将总体的全部数据按大小顺序排列后,处于各等分位置的变量值;

中位数

如果将全部数据分成相等的两部分;

四分位数

如果分成四等分;也称为四分位点;将全部数据分成相等的四部分,其中每部分包括25%的数据,处于各分位点的数值;四分位数有三个

  • 第一个四分位数---下四分位数;

    • 也称为“较小四分位”,等于该样本中所有数值由小到大排列后第25%的数字;

  • 第二个四分位数---中位数

    • 也称为“中位数”,等于该样本中所有数值由小到大排列后第50%的数字;

  • 第三个四分位数---上四分位数;

    • 也称为“较大四分位数”,等于该样本中所有数值由小到大排列后第75%数字;第三个四分位数与第一个四分位数的差距又称为四分位距(InterQuartile Range,IQR);

箱形图通常用于描述性统计

  • 直观明了地识别批量数据中的异常值;

  • 利用箱型图判断批量数据的偏态和尾重;

箱型图系列绘制方法

  • plotnine包中的geom_boxplot()函数可以绘制箱型图;

  • 再使用geom_jitter()函数绘制抖动散点图;

绘制带误差线的箱形图

import pandas as pd

import numpy as np

import seaborn as sns

import matplotlib.pyplot as plt

from plotnine import *

df=pd.read_csv('d:\python\out\DistributionD.csv')

df['class']=df['class'].astype("category", ["n", "s", "k", "mm"])

#带误差线的箱型图

box_plot=(ggplot(df,aes(x='class',y="value",fill="class"))

+geom_boxplot(show_legend=False)

+scale_fill_hue(s = 0.90, l = 0.65, h=0.0417,color_space='husl')

+theme_matplotlib()

+theme(aspect_ratio =1.05,

dpi=100,

figure_size=(4,4)))

print(box_plot)

box_plot.save("box_plot.pdf")

绘制箱型与抖动散点组合图

import pandas as pd

import numpy as np

import seaborn as sns

import matplotlib.pyplot as plt

from plotnine import *

df=pd.read_csv('d:\python\out\DistributionD.csv')

df['class']=df['class'].astype("category",["n", "s", "k", "mm"])

#箱型与抖动散点组合图

box_plot1=(ggplot(df,aes(x='class',y="value",fill="class"))

+geom_boxplot(show_legend=False)

+geom_jitter(fill="black",shape=".",width=0.3,size=3,stroke=0.1,show_legend=False)

+scale_fill_hue(s = 0.90, l = 0.65, h=0.0417,color_space='husl')

+theme_matplotlib()

+theme(aspect_ratio =1.05,

dpi=100,

figure_size=(4,4)))

print(box_plot1)

box_plot.save("box_plot2.pdf")

箱形图适用于哪种数据_python数据分布型图表箱形图系列带误差线箱形图相关推荐

  1. python 分布图_python数据分布型图表柱形分布图系列带误差线的柱形图

    柱形分布图系列 柱形分布图系列 使用柱形图的方式展示数据的分布规律: 可以借助误差线或散点图: 带误差线的柱形图就是使用每个类别的均值作为柱形的高度: 再根据每个类别的标准差绘制误差线: 缺点:无法显 ...

  2. matlab 条形图误差线,数据可视化系列:手把手教你绘制带误差线的条形图

    原标题:数据可视化系列:手把手教你绘制带误差线的条形图 条形图可以用于展示数据不同分类下的均值.中位数.标准差和置信区间等,Excel可以实现,但对于带误差线的条形图而言,还是比较麻烦的.R语言的基础 ...

  3. 箱形图适用于哪种数据_Python数据分析之Seaborn(分类分析绘图 )

    ​Seaborn分类分析绘图 %matplotlib inlineimport numpy as npimport pandas as pdimport matplotlib as mplimport ...

  4. 箱形图适用于哪种数据_盘点 | 十分钟进阶Excel数据可视化

    过·往 半年前,开了一个叫"知识点"的小专题,陆陆续续分享了一些数据可视化相关的东西.其中Excel相关16篇,Tableau相关3篇,Ai相关3篇,D3.js相关2篇. 刚开始的 ...

  5. python分析股票数据_Python数据可视化——股票数据分析

    1.背景 GAFATA,它表示的是GOOGLE,AMAZON,FACEBOOK,APPLE,TENCENT,ALIBABA这六家互联网巨头的首字母缩写.本文主要分析GAFATA这六家公司股票近一年的的 ...

  6. matplotlib柱状图上方显示数据_Python数据可视化之matplotlib

    数据可视化能让人们更直观的传递数据所要表达的信息.Python 中有两个专用于可视化的库,matplotlib 和 seaborn ,本文将介绍matplotlib. Matplotlib:基于Pyt ...

  7. python统计excel中重复数据_Python中用pandas对标Excel自带功能——去除重复项

    经常听别人说 Python 在数据领域有多厉害,结果学了很长时间,连数据处理都麻烦得要死.后来才发现,原来不是 Python 数据处理厉害,而是他有数据分析神器-- pandas 前言 有时候数据中出 ...

  8. ggplot:截断坐标轴的折线图(带误差线)

    library("ggplot2") library("ggbreak") library(RColorBrewer)# 主题 ---------------- ...

  9. js 处理十万条数据_Python数据可视化2018:为什么这么多的库?

    在奥斯汀举行的SciPy2018特别会议上,许多开源Python可视化工具的代表分享了他们对于Python数据可视化未来发展的不同观点.我们听到了关于Matplotlib,Plotly以及VisPy等 ...

  10. python归档excel数据_python 数据存储excel

    Python的小数据存储,用什么格式更有逼格? 小数据存储 我们在编写代码的时候,经常会涉及到数据存储的情况,如果是爬虫得到的大数据,我们会选择使用数据库,或者excel存储.但如果只是一些小数据,或 ...

最新文章

  1. mysql 打印_故障分析 | MySQL:5.6大事务show engine innodb status故障一例
  2. 20155226 2016-2017-2 《Java程序设计》第一周学习总结
  3. ACM题解系列之一:刘汝佳:《算法竞赛入门经典》(第2版)
  4. python字符串反转方法_Python程序使用堆栈和反转方法反转字符串
  5. MySQL进阶之索引
  6. vs 如何将源文件转换成可执行文件_如何将图片文件转换成PDF文件?
  7. 【离散数学】单向连通和弱连通的区别
  8. Oracle GoldenGate理论
  9. git 常用命令及虚拟机服务器仓库搭建
  10. C++基础教程,基本的输入输出
  11. HTMLCSS 第五天 笔记
  12. BZOJ2160 拉拉队排练
  13. AVOD:点云数据与BEV图的处理及可视化
  14. 下载 Flash Player 强制跳转至 flash.cn,无法下载国际版 Flash 解决方法
  15. 新百家姓前20位(附前300名)
  16. Hive实现同比环比计算
  17. php cms 301,www域名301
  18. GIS软件——arcgis10.2制作符号并链接符号库
  19. java斗地主发牌_实现斗地主发牌(java)
  20. java英雄国度加速版_谷得游戏 - 评价 | TapTap 发现好游戏

热门文章

  1. 笔迹心理学(2): 功能设计
  2. macOS 虚拟摄像头:CamTwist for Mac
  3. Pollard Rho 质因数分解
  4. vue-print 实现打印功能
  5. 软考高级 真题 2016年下半年 信息系统项目管理师 案例分析
  6. IP地址 网关是什么?网络概念
  7. 数据结构课程设计:17、售票处的服务系统(***)
  8. blob/text column 'content' used in key specification without a key length
  9. DWT(离散小波变换)
  10. c 语言查询条件并列怎么用,关于C# if语句中并列条件的执行