Python热力图寻找缺失数据

你有没有遇到一种情况,处理一张很大的csv表格的时候很难找到表格中每一列的缺失数据,或者说处理速度非常慢

?当然如果你的Excel水平非常高,这个可能不会成为你的问题,但如果当你想可视化出每一列缺失数据的分布和数量怎么办呢?这时候就需要用Python绘制热力图了!

1.安装所需要的第三方Python库

在开始之前我们需要安装以下Python包(库),打开你的CMD(Windows系统)/Terminal(macOS系统)输入以下指令即可: pip install seaborn

pip install pandas

pip install matplotlib

其中pandas是用于数据操作与处理的,matplotlib和seaborn主要用于Python数据可视化,也就是绘制我们所需要的热力图。

2.Python加载数据

好了,废话不多说,让我们现在就开始使用panda加载数据:

import pandas as pd

import numpy as np

import seaborn

import matplotlib

data = pd.read_csv('training_data.csv')

没错,pandas的使用就这么简单,读取csv文件直接使用read_csv函数,你可以使用自己需要的csv文件,也可以使用我们提供的:点击下载 Python推特机器人分类数据集 中的training_data.csv,只需要你移动到当前代码的文件夹下即可。

3.Python构造热力图

使用Python构造热力图识别表格的缺失数据:

seaborn.heatmap(data.isnull(), yticklabels=False, cbar=False, cmap='viridis')

# 热力图,当data中有空值时标为黄色

matplotlib.pyplot.tight_layout()

matplotlib.pyplot.show() Python热力图寻找缺失数据

seaborn.heatmap用于生成热力图,其会检查data中的每个单元格,如果为空则标记为黄色,cmap为颜色图谱,viridis即蓝-绿-黄. 此外,matplotlib.pyplot主要用于负责展示图片。如果你需要知道seaborn更详细的参数文档,可以阅读这篇文章。

整体代码如下(一共只用了7行

)

import pandas as pd

import seaborn

import matplotlib

data = pd.read_csv('training_data.csv')

seaborn.heatmap(data.isnull(), yticklabels=False, cbar=False, cmap='viridis')

matplotlib.pyplot.tight_layout()

matplotlib.pyplot.show()

我们的文章到此就结束啦,如果你希望我们今天的Python 教程,请持续关注我们,如果对你有帮助,麻烦在下面点一个赞/在看哦

有任何问题都可以在下方留言区留言,我们都会耐心解答的!

​Python实用宝典 (pythondict.com)

不只是一个宝典

欢迎关注公众号:Python实用宝典

本文由 Python 实用宝典 作者:Python实用宝典 发表,其版权均为 Python 实用宝典 所有,文章内容系作者个人观点,不代表 Python 实用宝典 对观点赞同或支持。如需转载,请注明文章来源。

python用excel数据做热力图_7行代码 Python热力图可视化分析缺失数据处理-Python 实用宝典...相关推荐

  1. Python读写Excel数据(指定某行某列)

    Python读写Excel数据(指定某行某列) 在Python数据处理中,经常需要对Excel表格进行读写操作,本文的代码介绍了如何通过行与列的下标进行数据的读写:代码对数据格式有要求,读数据要求文件 ...

  2. python 拆分excel工作表_Python几行代码轻松拆分表格

    Python几行代码轻松拆分表格 作者:梅朵 微信公众号:实用办公编程技能 微信号:Excel-Python 什么?,Python几行代码竟然可以按指定轻松拆分表格? 将test.xls中的数据按地区 ...

  3. 用python处理excel数据做函数_如何使用python通过函数式编程完成excel中的数据处理及分析工作...

    Excel是数据分析中最常用的工具,本篇文章通过python与excel的功能对比介绍如何使用python通过函数式编程完成excel中的数据处理及分析工作.在Python中pandas库用于数据处理 ...

  4. python编程人脸识别工具_几行代码带你实现人脸识别。Python 就是这么简单

    本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理 以下文章来源于腾讯云 作者:Python编程与实战 阅读文本大概需要 11分钟. ...

  5. python导入excel数据-Python数据处理之导入导出excel数据

    欢迎点击上方"AntDream"关注我 .Python的一大应用就是数据分析了,而数据分析中,经常碰到需要处理Excel数据的情况.这里做一个Python处理Excel数据的总结, ...

  6. python做excel自动化视频教程-从零基础入门到精通用Python处理Excel数据视频教程...

    从零基础入门到精通用Python处理Excel数据视频教程 1.从零基础开始用python处理Excel数据 1-1 什么是python.mp4 1-2 为什么要学习用Python处理Excel表格. ...

  7. 《用 Python 处理 Excel 数据之正则表达式视频教程》 曾贤志

    第1章 正则表达式常用函数与方法使用 正则表达式(regular expression)描述了一种字符串匹配的模式(pattern),可以用来检查 一个串是否含有某种子串.对匹配成功的字符串进行提取. ...

  8. 用python在excel中做批量计算(包括单元格为空值时的处理情况)

    现有如下某城市的2000-2017年人口和GDP数据的excel文件,需要计算其中人均GDP这一列的指标结果. 虽然这个工作在excel中直接下拉公式即可完成,但如果有50个城市的该种数据,显然下拉公 ...

  9. python处理excel表格中合并的行

    python处理excel数据的时候 有时候会出现一对多 也就是前面的数据会合并起来 后面的却分开类似下面这种情况 使用pandas进行读取之后,只会在第一行出现 其他都为空值 其实处理这种数据很简单 ...

最新文章

  1. 如果你没用过maven的install,你应该了解一下!maven中的install功能及用法。
  2. 使用JSON.parse(),JSON.stringify()实现对对象的深拷贝
  3. 牛客网(剑指offer) 第十五题 反转链表
  4. 关于django新版本无法使用MySQL数据库的问题
  5. eth_type_trans的处理流程图
  6. SQL Server 2019中的图形数据库功能–第1部分
  7. 2017广东工业大学程序设计竞赛决赛:G. 等凹数字(数位DP)
  8. 一个传统的前端框架的布局
  9. 计算机网络知识点整理
  10. 铁路售票系统_城轨交通地高铁车站自动售检票(AFC)实训系统解决方案
  11. Spark源码系列(六)Shuffle的过程解析 - 岑玉海
  12. 拇指玩」制作的「谷歌安装器」app
  13. 基于J2EE的弹幕视频网站设计
  14. 使用Java在图片中添加文字
  15. mysql别名_MySQL设置别名
  16. MEMS智能传感器技术的新进展
  17. 声网Agora Lipsync技术剖析:通过实时语音驱动人像模拟真人说话
  18. 全球与中国1-苄基吡啶嗡-3-羧酸盐市场深度研究分析报告
  19. 简易的本地音乐播放器 适用于Java初学者
  20. 世界各国领土面积大排行

热门文章

  1. Ubuntu 20.04 LTS 安装坚果云
  2. HBuilder X运行微信小程序项目至微信开发者工具失败
  3. Android利剑之——通知栏提醒
  4. 公司网络的运行与管理
  5. arcgis fishnet 单位_ArcGIS中使用Create Fishnet生成格网
  6. 创建 360 压缩bat文件
  7. 时尚博主gogoboi的品牌集合店“不大精选”入驻天猫
  8. 学习Java要下载什么软件?用来做什么?
  9. html表格美化源码,非常酷炫的CSS3表格设计样式源码
  10. 趣味编程-现代诗词中的高频词语