文章目录

  • 前言
  • 一、箱型图是什么?
    • 1-1、箱型图介绍
    • 1-2、箱型图的作用
    • 1-3、实战
  • 二、Q-Q图是什么?
    • 2-1、Q-Q图(分位数-分位数图:quantile-quantile plot)介绍
    • 2-2、实战
    • 2-3、为什么要使数据呈现正态分布以及出现了正态分布,数据应该如何处理?
  • 三、Kde图是什么?
    • 3-1、Kde图介绍
    • 3-2、实战
    • 3-3、分布不一致如何处理?
  • 三、线性回归图
    • 4-1、线性回归图绘制函数介绍
    • 4-2、实战
    • 4-3、相关性不高如何处理?
  • 总结

前言

爱意随风起,风止意难平。


一、箱型图是什么?

1-1、箱型图介绍

箱型图:箱线图也称箱须图、箱形图、盒图,用于反映一组或多组连续型定量数据分布的中心位置和散布范围。箱形图包含数学统计量,不仅能够分析不同类别数据各层次水平差异,还能揭示数据间离散程度、异常值、分布差异等等。

下边缘(Q1),表示最小值;下四分位数 - 1.5 ×(上四分位数-下四分位数)
下四分位数(Q2),又称“第一四分位数”,等于该样本中所有数值由小到大排列后第25%的数字;
中位数(Q3),又称“第二四分位数”等于该样本中所有数值由小到大排列后第50%的数字;
上四分位数(Q4),又称“第三四分位数”等于该样本中所有数值由小到大排列后第75%的数字;
上边缘(Q5),表述最大值。上四分位数 + 1.5 ×(上四分位数-下四分位数)
异常值:在上边缘和下边缘的范围之外,就是异常值。

1-2、箱型图的作用

1、箱子的宽度在一定程度上反映了数据的波动程度,箱体越扁说明数据越集中,而箱体越长,则说明数据越分散。
2、可以清晰地观察到数据的整体分布情况,可以清楚的看到数据的下边缘、下四分位数、中位数、上四分位数、上边缘、异常值。
3、箱型图最大的优点是不受异常值的影响,可以以一种相对稳定的方式描述数据的离散分布情况。
4、对于太离谱的值,可以直接删掉,亦或者是变为缺失值,按照缺失值来处理,比如说均值填充、众数填充、中位数填充、使用其他数据来预测该值等等。

1-3、实战

# 使用matplotlib和seaborn来绘制图像
import matplotlib.pyplot as plt
import seaborn as sns# 设置尺寸。
fig = plt.figure(figsize=(8, 12))  # 指定绘图对象宽度和高度
# 以y为轴进行绘制
sns.boxplot(y = [2,4,6,8,10,20,-8,50,-20], width=0.5)

二、Q-Q图是什么?

2-1、Q-Q图(分位数-分位数图:quantile-quantile plot)介绍

Q-Q图:Q-Q(分位数 - 分位数)图是概率图,其是通过将绘制两个概率分布的分位数来比较两者分布关系的图形方法,主要作用是判断样本是否近似于某种类型的分布,这里以正态分布为例。

注意:蓝色越接近红色参考线,说明越符合预期分布。

2-2、实战

import matplotlib.pyplot as plt
import seaborn as sns
from scipy import statsfig = plt.figure()
# 第一个参数:从哪个样本中创建。
res = stats.probplot(train[‘SalePrice’], plot=plt)
# 默认检测是正态分布# 完整写
# stats.probplot(grade, dist=stats.norm, plot=plt)        #正态分布
# stats.probplot(grade, dist=stats.expon, plot=plt)       #指数分布
# stats.probplot(grade, dist=stats.logistic, plot=plt)      # 对数正态分布
plt.show()

通常配合直方图来一起分析

数据分析可视化常用图介绍以及相关代码实现(箱型图、Q-Q图、Kde图、线性回归图、热力图)相关推荐

  1. Market1501数据集介绍及相关代码

    Market1501数据集介绍及相关代码 1.数据集介绍 文件夹介绍 bounding_box_test:测试集,gallery bounding_box_train:训练集 query:prob g ...

  2. 数据分析可视化之模型介绍

    一 前言 "数据分析可视化"这条术语实现了成熟的科学可视化领域与较年轻的信息可视化领域的统一. 数据分析可视化:是指将大型数据集中的数据以图形图像形式表示,并利用数据分析和开发工具 ...

  3. python 数据分析可视化实战 超全 附完整代码数据

    代码+数据:https://download.csdn.net/download/qq_38735017/87379914 1.1 数据预处理 1.1.1 异常值检测 ①将支付时间转为标准时间的过程中 ...

  4. 可解释性神经网络(可视化):CAM/Grad-CAM pytorch相关代码

    目录 为什么神经网络要具有可解释性 前言 类激活图(CAM,class activation map),可视化 1.1 CAM的工作原理 2. 基于梯度的CAM(Grad-CAM) pytorch 实 ...

  5. 数据分析可视化利器:python pandas-profiling 一行代码EDA 探索性数据分析

    文章大纲 1. 探索性数据分析 2.代码样例 3.效果 4.解决pandas profile 中文显示的问题 1. 探索性数据分析 数据的筛选.重组.结构化.预处理等都属于探索性数据分析的范畴,探索性 ...

  6. Py之seaborn:数据可视化seaborn库(二)的组合图可视化之密度图/核密度图分布可视化、箱型图/散点图、小提琴图/散点图组合可视化的简介、使用方法之最强攻略(建议收藏)

    Py之seaborn:数据可视化seaborn库(二)的组合图可视化之密度图/核密度图分布可视化.箱型图/散点图.小提琴图/散点图组合可视化的简介.使用方法之最强攻略(建议收藏) 目录 二.组合图可视 ...

  7. python数据分析常用包_python可视化数据分析常用图大集合(收藏)

    python数据分析常用图大集合:包含折线图.直方图.垂直条形图.水平条形图.饼图.箱线图.热力图.散点图.蜘蛛图.二元变量分布.面积图.六边形图等12种常用可视化数据分析图,后期还会不断的收集整理, ...

  8. python数据分析常用图大集合

    我们在做数据分析的时候,难免会用到图像来表示你要展示的东西,接下来写一下demo来表示一下各种图: 以下默认所有的操作都先导入了numpy.pandas.matplotlib.seaborn impo ...

  9. python常用数据作图--matplotlib用法(相关设置及常用图)

    目录 1.pyplot的plot( )函数 1.1 函数参数 1.2 函数应用 2. 常用figures,axes(多图形.坐标系) 2.1 创建fig,axes 2.2 基本绘图2D设置 1) pl ...

最新文章

  1. 输入一个字符串,用子函数完成在字符串中找出ACSII码值最大的字符,将其放在第一个位置,并将该字符前的所有字符向后顺序移动
  2. windows下codelite的使用
  3. Receiver ED、Link quality indicator (LQI)、Clear channel assessment (CCA)究竟是什么?802.15.4标准
  4. 单向链表的 js 实现
  5. Java知识点汇总1
  6. Thinkphp5 模型 验证器执行顺序问题
  7. Laravel-数据库队列
  8. 本地提交到yarn_Yarn运行Flink作业 0449
  9. Julia : varinfo() 与工作空间,@isdefined, @which
  10. Java二级知识总结
  11. 宝塔搭建实测-基于ThinkPHP5.1的wms进销存源码
  12. Python:自适应滤波器简介及其实现方法
  13. 2021多校补题(8)
  14. m分别使用ESN网络,ESN+RBF神经网络以及ESN+Volterra网络进行数据预测对比仿真
  15. lpk劫持方式粘滞键后门后门T00ls Lpk Sethc v3.0 正式版下载
  16. 正序 逆序写 java_C语言版和JAVA版 把一个字节正序(高位在前)转为逆序(低位在前) 和 逆序转为正序...
  17. c语言蒸汽流量温度压力补偿运算,当蒸汽流量测量使用温度压力补偿,这七点不容忽略!...
  18. MyBatis自动生成实体类、DAO接口和Mapping映射文件的代码(逆向工程)
  19. CentOS 7 关闭 swap 分区
  20. 大数据之Hive:正则表达式

热门文章

  1. nekohtml解析html(string或是文件流)
  2. USB Type-A/Type-B/Type-C/mini-AB/micro-AB接口简介
  3. Exchange 2007 被攻击
  4. Siteground和Bluehost对比,我花了7天时间研究出了结果
  5. 三步跳过wegame登录
  6. web前端高级React - React从入门到进阶之React条件渲染
  7. 通过IDEA进行class文件代码反编译
  8. 理解镜像、容器和存储驱动
  9. 有必要升级到php7,升级到 PHP 7.4
  10. php++think命令报错,think命令行