python boxplot pvalue_1.1.1数据质量分析Python boxplot,111,箱,线图
原理
1.箱线图介绍
箱形图(Box-plot)又称为盒须图、盒式图或箱线图,是一种用作显示一组数据分散情况资料的统计图。
中位数:一组数据按顺序排列,从小至大第50%位置的数值
上四分位数(Q1):一组数据按顺序排列,从小至大第25%位置的数值
下四分位数(Q3):一组数据按顺序排列,从小至大第75%位置的数值
四分位数和下四分位数之间的差值,即四分位数差(IQR,interquartile range)Q3-Q1
上限值:Q1-1.5×IQR(大于上四分位数1.5倍四分位数差的值)
下限值:Q3+1.5×IQR(小于下四分位数1.5倍四分位数差的值)
离群值(异常值):一组数据中超过上下限的真实值
这两条线段为异常值截断点,称其为内限
在Q3+3IQR和Q1-3IQR处画两条线段,称其为外限。
极端异常值,即超出四分位数差3倍距离的异常值,用实心点表示;
温和异常值,即处于1.5倍-3倍四分位数差之间的异常值,用空心点表示。
2.代码
boxplot函数的参数解读
plt.boxplot(
x, // 指定要绘制箱线图的数据
notch=None, // 是否是凹口的形式展现箱线图,默认非凹口:False—非凹口—更好看
sym=None, // 指定异常点的形状,默认为+号显示,没有懂什么意思???
vert=None, // 是否需要将箱线图垂直摆放,默认垂直摆放,Ture—垂直摆放
whis=None, // 指定上下须与上下四分位的距离,默认为1.5*IQR, 指定其他距离???
positions=None, // 指定箱线图的位置,默认为[0,1,2…];
widths=None, // 指定(中间箱子)箱线图的宽度,默认为0.5;
patch_artist=None, // 是否填充箱体的颜色,True—填充
meanline=None, // 是否用线的形式表示均值,默认用点来表示:True—虚线,False—三角点
showmeans=None, // 是否显示均值,默认不显示:True—显示,配合meanline使用
showcaps=None, // 是否显示箱线图顶端和末端的两条线,默认显示:False—不显示
showbox=None, // 是否显示箱线图的箱体,默认显示:True—显示
showfliers=None, // 是否显示异常值,默认显示 :False—不显示
boxprops=None, // 设置箱体的属性,如边框色,填充色等配合patch_artist使用
labels=None, // 为箱线图添加标签,类似于图例的作用
flierprops=None, // 设置异常值的属性,如异常点的形状、大小、填充色等;
medianprops=None, // 设置中位数的属性,如线的类型、粗细等;
meanprops=None, // 设置均值的属性,如点的大小、颜色等;
capprops=None, // 设置箱线图顶端和末端线条的属性,如颜色、粗细等;
whiskerprops=None // 设置须的属性,如颜色、粗细、线的类型等
)
示例
def programmer_1(file_name):
catering_sale = file_name
data = pd.read_excel(catering_sale, index_col=u'日期')
plt.figure(figsize=(15,5)) // 变量过多,设置大小
# 画箱线图
p = data.boxplot(return_type='dict')
programmer_1(r'D:\XXX\Python\python_data_analysis_and_mining_action-master\chapter3\data\catering_sale_all.xls')
python boxplot pvalue_1.1.1数据质量分析Python boxplot,111,箱,线图相关推荐
- 小提琴统计图_R语言数据可视化系列(4)箱线图和小提琴图(附详细代码)
本文希望教会大家运用R语言绘制箱线图和小提琴图.小提琴图能同时查看数据的分布和描述性统计,是一种非常实用的可视化图形. 箱线图/盒须图 绘制连续型变量常用的五个描述性统计量,从下到上依次是:最小值,下 ...
- Python数据可视化:如何创建箱线图
一图胜千言,使用Python的matplotlib库,可以快速创建高质量的图形. 我们团队推出一个新的系列教程:Python数据可视化,针对初级和中级用户,将理论和示例代码相结合,使用matplotl ...
- python数据可视化 matplotlib(2) 小白 - 典型图形进阶版:堆积折线图/并列柱状图/阶梯图/箱线图
今天依然是matplotlib,在入门版的基础上加入了更多的组合和样式设置,matplotlib库是建立在Numpy基础上的绘图库. 典型统计图形对比 柱状图 堆积图:将若干统计图形堆叠起来的统计图形 ...
- python双坐标轴箱线图_python matplotlib箱线图
参考链接:https://www.jianshu.com/p/b2f70f867a4a 箱线图,又称箱形图(boxplot)或盒式图,不同于一般的折线图.柱状图或饼图等传统图表,只是数据大小.占比.趋 ...
- 箱线图(Boxplot)
箱线图(Boxplot)也称箱须图(Box-whisker Plot),箱形图等,1977年由美国著名统计学家约翰·图基(John Tukey)发明,是一种用作显示一组数据分散情况资料的统计图,利用数 ...
- 【数据处理】python matplotlib 画箱线图;箱线图介绍;如何画箱线图
一.箱线图介绍 假设一组数据有n个数,将它们从小到大排列,分为四等分.位于第25%(n+1)位置的数字是第一四分位数Q1.位于第50%(n+1)位置的数字是第二四分位数Q2,也是中位数.位于第75%( ...
- 数据可视化之箱线图详解
一.箱线图 箱线图(Box-plot)又称盒须图.盒式图或箱形图,是一种用作显示一组数据分散情况资料的统计图,在数据分析中经常被使用到,可以被用于异常值的检测. 通过箱线图可以很容易找到数据中的异常值 ...
- java boxplot_箱线图(boxplot)简介与举例
直观地识别数据集中的异常值(查看离群点). 判断数据集的数据离散程度和偏向(观察盒子的长度,上下隔间的形状,以及胡须的长度). 实例: 12位商学院毕业生月起薪的样本在这里按升序重复如下. 2710 ...
- python如何读dat数据_如何用Python进行数据质量分析
概述 数据挖掘的第一步工作是数据准备,而数据准备的第一步就是数据质量分析了.本篇文章着重介绍如何使用Python进行数据质量分析的初步工作,属于比较基础的入门教程. 为什么要进行数据质量分析 根据百度 ...
最新文章
- 网站响应慢的原因分析
- Apache开源项目
- cocosStudio制作ScrollView并在cocos2dx 3.0中使用。
- SASS 和 SCSS 的区别
- jquery-autocomplete学习(转)
- Spark学习笔记:使用RDD
- 江苏一女子给程序员老公买假发,看到其后脑勺后,网友们哭笑不得
- 网络安全相关行业必备网站
- 每周更新:Element、Vant新版本更新、IntelliJ IDEA 2019.1 发布 RC 候选版、企业级 UI 设计语言Ant Design 3.15.2 发布
- cad学生版和教育版_针对学生和教育者的3个版权提示
- beetl 页面标签_高级用法 · Beetl3官方文档 · 看云
- 华为路由器配置备忘录
- PLC与7种常见输入输出设备的连接方式
- PyQt5实时汇率查询
- tensorflow入门教程(二十六)人脸识别(上)
- 网盘搜索插件php源码,PHP网盘资源搜索源码 127盘搜网盘搜索神器 THINKPHP内核
- 菜鸟窝BAT企业安卓学习笔记
- 使整个网页变黑白色(灰色)的特效代码
- laravel-admin使添加、编辑按钮支持附带参数
- 让动画不再僵硬:Facebook Rebound Android动画库介绍