原理

1.箱线图介绍

箱形图(Box-plot)又称为盒须图、盒式图或箱线图,是一种用作显示一组数据分散情况资料的统计图。

中位数:一组数据按顺序排列,从小至大第50%位置的数值

上四分位数(Q1):一组数据按顺序排列,从小至大第25%位置的数值

下四分位数(Q3):一组数据按顺序排列,从小至大第75%位置的数值

四分位数和下四分位数之间的差值,即四分位数差(IQR,interquartile range)Q3-Q1

上限值:Q1-1.5×IQR(大于上四分位数1.5倍四分位数差的值)

下限值:Q3+1.5×IQR(小于下四分位数1.5倍四分位数差的值)

离群值(异常值):一组数据中超过上下限的真实值

这两条线段为异常值截断点,称其为内限

在Q3+3IQR和Q1-3IQR处画两条线段,称其为外限。

极端异常值,即超出四分位数差3倍距离的异常值,用实心点表示;

温和异常值,即处于1.5倍-3倍四分位数差之间的异常值,用空心点表示。

2.代码

boxplot函数的参数解读

plt.boxplot(

x, // 指定要绘制箱线图的数据

notch=None, // 是否是凹口的形式展现箱线图,默认非凹口:False—非凹口—更好看

sym=None, // 指定异常点的形状,默认为+号显示,没有懂什么意思???

vert=None, // 是否需要将箱线图垂直摆放,默认垂直摆放,Ture—垂直摆放

whis=None, // 指定上下须与上下四分位的距离,默认为1.5*IQR, 指定其他距离???

positions=None, // 指定箱线图的位置,默认为[0,1,2…];

widths=None, // 指定(中间箱子)箱线图的宽度,默认为0.5;

patch_artist=None, // 是否填充箱体的颜色,True—填充

meanline=None, // 是否用线的形式表示均值,默认用点来表示:True—虚线,False—三角点

showmeans=None, // 是否显示均值,默认不显示:True—显示,配合meanline使用

showcaps=None, // 是否显示箱线图顶端和末端的两条线,默认显示:False—不显示

showbox=None, // 是否显示箱线图的箱体,默认显示:True—显示

showfliers=None, // 是否显示异常值,默认显示 :False—不显示

boxprops=None, // 设置箱体的属性,如边框色,填充色等配合patch_artist使用

labels=None, // 为箱线图添加标签,类似于图例的作用

flierprops=None, // 设置异常值的属性,如异常点的形状、大小、填充色等;

medianprops=None, // 设置中位数的属性,如线的类型、粗细等;

meanprops=None, // 设置均值的属性,如点的大小、颜色等;

capprops=None, // 设置箱线图顶端和末端线条的属性,如颜色、粗细等;

whiskerprops=None // 设置须的属性,如颜色、粗细、线的类型等

)

示例

def programmer_1(file_name):

catering_sale = file_name

data = pd.read_excel(catering_sale, index_col=u'日期')

plt.figure(figsize=(15,5)) // 变量过多,设置大小

# 画箱线图

p = data.boxplot(return_type='dict')

programmer_1(r'D:\XXX\Python\python_data_analysis_and_mining_action-master\chapter3\data\catering_sale_all.xls')

python boxplot pvalue_1.1.1数据质量分析Python boxplot,111,箱,线图相关推荐

  1. 小提琴统计图_R语言数据可视化系列(4)箱线图和小提琴图(附详细代码)

    本文希望教会大家运用R语言绘制箱线图和小提琴图.小提琴图能同时查看数据的分布和描述性统计,是一种非常实用的可视化图形. 箱线图/盒须图 绘制连续型变量常用的五个描述性统计量,从下到上依次是:最小值,下 ...

  2. Python数据可视化:如何创建箱线图

    一图胜千言,使用Python的matplotlib库,可以快速创建高质量的图形. 我们团队推出一个新的系列教程:Python数据可视化,针对初级和中级用户,将理论和示例代码相结合,使用matplotl ...

  3. python数据可视化 matplotlib(2) 小白 - 典型图形进阶版:堆积折线图/并列柱状图/阶梯图/箱线图

    今天依然是matplotlib,在入门版的基础上加入了更多的组合和样式设置,matplotlib库是建立在Numpy基础上的绘图库. 典型统计图形对比 柱状图 堆积图:将若干统计图形堆叠起来的统计图形 ...

  4. python双坐标轴箱线图_python matplotlib箱线图

    参考链接:https://www.jianshu.com/p/b2f70f867a4a 箱线图,又称箱形图(boxplot)或盒式图,不同于一般的折线图.柱状图或饼图等传统图表,只是数据大小.占比.趋 ...

  5. 箱线图(Boxplot)

    箱线图(Boxplot)也称箱须图(Box-whisker Plot),箱形图等,1977年由美国著名统计学家约翰·图基(John Tukey)发明,是一种用作显示一组数据分散情况资料的统计图,利用数 ...

  6. 【数据处理】python matplotlib 画箱线图;箱线图介绍;如何画箱线图

    一.箱线图介绍 假设一组数据有n个数,将它们从小到大排列,分为四等分.位于第25%(n+1)位置的数字是第一四分位数Q1.位于第50%(n+1)位置的数字是第二四分位数Q2,也是中位数.位于第75%( ...

  7. 数据可视化之箱线图详解

    一.箱线图 箱线图(Box-plot)又称盒须图.盒式图或箱形图,是一种用作显示一组数据分散情况资料的统计图,在数据分析中经常被使用到,可以被用于异常值的检测. 通过箱线图可以很容易找到数据中的异常值 ...

  8. java boxplot_箱线图(boxplot)简介与举例

    直观地识别数据集中的异常值(查看离群点). 判断数据集的数据离散程度和偏向(观察盒子的长度,上下隔间的形状,以及胡须的长度). 实例: 12位商学院毕业生月起薪的样本在这里按升序重复如下. 2710 ...

  9. python如何读dat数据_如何用Python进行数据质量分析

    概述 数据挖掘的第一步工作是数据准备,而数据准备的第一步就是数据质量分析了.本篇文章着重介绍如何使用Python进行数据质量分析的初步工作,属于比较基础的入门教程. 为什么要进行数据质量分析 根据百度 ...

最新文章

  1. 网站响应慢的原因分析
  2. Apache开源项目
  3. cocosStudio制作ScrollView并在cocos2dx 3.0中使用。
  4. SASS 和 SCSS 的区别
  5. jquery-autocomplete学习(转)
  6. Spark学习笔记:使用RDD
  7. 江苏一女子给程序员老公买假发,看到其后脑勺后,网友们哭笑不得
  8. 网络安全相关行业必备网站
  9. 每周更新:Element、Vant新版本更新、IntelliJ IDEA 2019.1 发布 RC 候选版、企业级 UI 设计语言Ant Design 3.15.2 发布
  10. cad学生版和教育版_针对学生和教育者的3个版权提示
  11. beetl 页面标签_高级用法 · Beetl3官方文档 · 看云
  12. 华为路由器配置备忘录
  13. PLC与7种常见输入输出设备的连接方式
  14. PyQt5实时汇率查询
  15. tensorflow入门教程(二十六)人脸识别(上)
  16. 网盘搜索插件php源码,PHP网盘资源搜索源码 127盘搜网盘搜索神器 THINKPHP内核
  17. 菜鸟窝BAT企业安卓学习笔记
  18. 使整个网页变黑白色(灰色)的特效代码
  19. laravel-admin使添加、编辑按钮支持附带参数
  20. 让动画不再僵硬:Facebook Rebound Android动画库介绍

热门文章

  1. mysql 唯一键和主键_MySQL唯一键和主键
  2. 【git】强制覆盖本地代码(与git远程仓库保持一致)
  3. eclipse中的maven build、maven clean、maven install和maven test的区别
  4. Python学习-基础篇7 网络编程
  5. openstack架构及组件特点
  6. CentOS 7.x安装配置
  7. 关于网络流sap算法
  8. Linux教程:内核怎样管理你的内存
  9. 一个多线程和队列的实例演示
  10. 23.2.3 高速缓存依赖性(1)