I have some questions about boxplots in matplotlib:

Question A. What do the markers that I highlighted below with Q1, Q2, and Q3 represent? I believe Q1 is maximum and Q3 are outliers, but what is Q2?

Question B How does matplotlib identify outliers? (i.e. how does it know that they are not the true max and min values?)

解决方案

Here's a graphic that illustrates the components of the box from a stats.stackexchange answer. Note that k=1.5 if you don't supply the whis keyword in Pandas.

The boxplot function in Pandas is a wrapper for matplotlib.pyplot.boxplot. The matplotlib docs explain the components of the boxes in detail:

Question A:

The box extends from the lower to upper quartile values of the data, with a line at the median.

i.e. a quarter of the input data values is below the box, a quarter of the data lies in each part of the box, and the remaining quarter lies above the box.

Question B:

whis : float, sequence, or string (default = 1.5)

As a float, determines the reach of the whiskers to the beyond the

first and third quartiles. In other words, where IQR is the

interquartile range (Q3-Q1), the upper whisker will extend to last

datum less than Q3 + whis*IQR). Similarly, the lower whisker will

extend to the first datum greater than Q1 - whis*IQR. Beyond the

whiskers, data are considered outliers and are plotted as individual

points.

Matplotlib (and Pandas) also gives you a lot of options to change this default definition of the whiskers:

Set this to an unreasonably high value to force the whiskers to show

the min and max values. Alternatively, set this to an ascending

sequence of percentile (e.g., [5, 95]) to set the whiskers at specific

percentiles of the data. Finally, whis can be the string 'range' to

force the whiskers to the min and max of the data.

python箱线图代码找出异常_matplotlib中的箱线图:标记和异常值相关推荐

  1. python字符串面试题:找出一个字符串中第一个字母和最后一个字符是第一次重复,中间没有重复且最长的子串...

    1.给出任意一个字符串,打印一个最长子串字符串及其长度,如果有相同长度的子字符串,都要一起打印出来,该子字符串满足以下条件, 第一个字母和最后一个字符是第一次重复 这个子字符串的中间字母没有重复 这个 ...

  2. Python数据挖掘05--词云(wordcloud)找出老九门中热门词语

    注意 window系统安装wordcloud模块时可能会出现需要安装C++等错误,此时使用https://www.lfd.uci.edu/~gohlke/pythonlibs/#scipy网站的whl ...

  3. python求反余弦_余弦相似度计算公式:python代码找出相似文章

    余弦相似度计算公式:python代码找出相似文章 用TF-IDF算法可以自动提取关键词.除了找到关键词,怎么找到与原文章相似的其他文章.比如,"百科TA说"在词条最下方,还提供多条 ...

  4. python counter 出现次数最少的元素_[PY3]——找出一个序列中出现次数最多的元素/collections.Counter 类的用法...

    问题 怎样找出一个序列中出现次数最多的元素呢? 解决方案 collections.Counter 类就是专门为这类问题而设计的, 它甚至有一个有用的 most_common() 方法直接给了你答案 c ...

  5. Python 一键吸猫!找出磁盘里所有猫照

    最近在整理我磁盘上的照片,发现不少猫照,突然觉得若能把这些猫照都挑出来,观察它们的成长轨迹也是一件不错的事情.一张一张的找实在是太费劲了,能不能自动化地找出来呢? 目标检测,是许多计算机视觉应用的重中 ...

  6. 电气论文实现:从大规模用户中找出异常用电用户

    个人电气目录链接; 学好电气全靠它,个人电气博文目录(持续更新中-) 最终结果部分截图 一.原始数据 负荷数据 文件名:zhenjiang_power.csv 第一列 :用户名ID: 第二列 :时间: ...

  7. JavaScript 4行代码找出重复出现次数最多的元素及次数

    JavaScript 4行代码找出重复出现次数最多的元素及次数 今天遇到的一个面试题,看起来比较简单,解题却用几个循环嵌套,感觉不对劲,后面又想了一个比较优雅的解法,如下: 解题思路 为数组内每个相同 ...

  8. python 列表求最大值_Python找出列表中的最大数和最小数

    Python找出列表中数字的最大值和最小值 思路: 先使用冒泡排序将列表中的数字从小到大依次排序 取出数组首元素和尾元素 运行结果: 源代码: 1 ''' 2 4.编写函数,功能:找出多个数中的最大值 ...

  9. python分词统计词频_-用python找出一篇文章中词频最高的20个单词

    python统计一个大文件中很多小文件里面的词频 #!/usr/bin/env python3.6 from collections import Counter from functools imp ...

  10. 快速找出一个数组中的两个数字,让这两个数字之和等于一个给定的值

    我觉得写得很清晰,希望没有侵犯作者的著作权,原文地址http://blog.csdn.net/hackbuteer1/article/details/6699642 快速找出一个数组中的两个数字,让这 ...

最新文章

  1. Spring创建对象的三种方式以及创建时间
  2. Linux问题分析或解决_ssh无法连接
  3. jzoj6290-倾斜的线【计算几何,贪心】
  4. 80-040-000-原理-MySQL的 ICP
  5. 数据结构与算法之间的关系
  6. 修改Linux用户的UID、GID
  7. 转 Androidpn里的Xmpp的理解(消息推送)
  8. mybatis中 bit类型判断
  9. 【操作系统/OS笔记15】死锁的系统模型,死锁的处理办法,银行家算法与死锁检验算法
  10. Action类一般情况为何要继承ActionSupport
  11. Oracle 官宣:腾讯 JDK 18 国内第一!
  12. 12.PHP-FPM
  13. AD Undeclared identifier: GetFontID 问题解决方法
  14. 使用C#创建一个进程杀手Windows服务
  15. 主板usb接口全部失灵_主板USB接口都无法使用故障
  16. 纯小白Python爬取东方财富网研报内容并通过机器学习的SVM模型进行文本分析(四)
  17. 《操作系统》之进程、线程、同步、死锁
  18. 再谈Spring(一):Bean的作用域
  19. c语言子函数定义与调用,C语言的简单函数定义与调用
  20. winform使用多线程时跨线程访问控件

热门文章

  1. Linux进程间通信之信号量
  2. 通过WDS功能扩大无线网范围
  3. 关于基础类数据结构的设计想法
  4. 在大多数人转向.NET和JAVA阵营的时候,我正在悄悄地向古老的COBOL招手
  5. 【java与智能设备】CH07_01_Android中的文件存储
  6. php5.2 xampp,使用XAMPP,如何將PHP 5.3替換為PHP 5.2?
  7. java 截取掉数字前面的0_java 保留字符串数字的位数,不够前面补0
  8. scala条件替换_Scala:如何使用scala替换Dataframe中的值
  9. java 正则表达式 替换 html,java 正则表达式 替换 html
  10. pythonrequest函数怎么编写出来的_python requests包的request()函数中的参数-params和data的区别简介...