点击上方“爱好Python的胡同学”,选择“星标”公众号

每晚八点,Python干货,不见不散!

数据可视化可以让我们很直观的发现数据中隐藏的规律,察觉到变量之间的互动关系,可以帮助我们更好的给他人解释现象,做到一图胜千文的说明效果。

常见的数据可视化库有:

  • matplotlib 是最常见的2维库,可以算作可视化的必备技能库,由于matplotlib是比较底层的库,api很多,代码学起来不太容易。

  • seaborn 是建构于matplotlib基础上,能满足绝大多数可视化需求。更特殊的需求还是需要学习matplotlib。

  • pyecharts 上面的两个库都是静态的可视化库,而pyecharts有很好的web兼容性,可以做到可视化的动态效果。

但是在数据科学中,几乎都离不开pandas数据分析库,而pandas可以做:

  • 数据采集:如何批量采集网页表格数据?

  • 数据读取:pd.read_csv/pd.read_excel

  • 数据清洗(预处理):理解pandas中的apply和map的作用和异同

  • 可视化,兼容matplotlib语法(今天重点)

准备工作

如果你之前没有学过pandas和matpltolib,我们先安装好这几个库

!pip3 install numpy!pip3 install pandas!pip3 install matplotlib

已经安装好,现在我们导入这几个要用到的库。使用的是伦敦天气数据,一开始我们只有12个月的小数据作为例子

#jupyter notebook中需要加这行代码%matplotlib inlineimport matplotlib.pyplot as pltimport numpy as npimport pandas as pd#读取天气数据df = pd.read_csv('data/london2018.csv')df

plot最简单的图

选择Month作为横坐标,Tmax作为纵坐标,绘图。

大家注意下面两种写法

#写法1df.plot(x='Month', y='Tmax')plt.show()

  • 横坐标轴参数x传入的是df中的列名Month

  • 纵坐标轴参数y传入的是df中的列名Tmax

折线图

上面的图就是折线图,折线图语法有三种

  • df.plot(x='Month', y='Tmax')

  • df.plot(x='Month', y='Tmax', kind='line')

  • df.plot.line(x='Month', y='Tmax')

df.plot.line(x='Month', y='Tmax')plt.show()

#grid绘制格线df.plot(x='Month', y='Tmax', kind='line', grid=True)plt.show()

多个y值

上面的折线图中只有一条线, 如何将多个y绘制到一个图中,比如Tmax, Tmin。

df.plot(x='Month', y=['Tmax', 'Tmin'])plt.show()

条形图

df.plot(x='Month',        y='Rain',        kind='bar')#同样还可以这样画#df.plot.bar(x='Month', y='Rain')plt.show()

水平条形图

bar环卫barh,就可以将条形图变为水平条形图

df.plot(x='Month',        y='Rain',        kind='barh')#同样还可以这样画#df.plot.bar(x='Month', y='Rain')plt.show()

多个变量的条形图

df.plot(kind='bar',        x = 'Month',       y=['Tmax', 'Tmin'])plt.show()

散点图

df.plot(kind='scatter',        x = 'Month',        y = 'Sun')plt.show()

饼形图

df.plot(kind='pie', y='Sun')plt.show()

上图绘制有两个小问题:

  • legend图例不应该显示

  • 月份的显示用数字不太正规

df.index = ['Jan','Feb','Mar','Apr','May','Jun','Jul','Aug','Sep','Oct','Nov','Dec']df.plot(kind='pie', y = 'Sun', legend=False)plt.show()

更多数据

一开头的数据只有12条记录(12个月)的数据,现在我们用更大的伦敦天气数据

import pandas as pddf2 = pd.read_csv('data/londonweather.csv')df2.head()

df2.Rain.describe()count    748.000000mean      50.408957std       29.721493min        0.30000025%       27.80000050%       46.10000075%       68.800000max      174.800000Name: Rain, dtype: float64

上面一共有748条记录, 即62年的记录。

箱型图

df2.plot.box(y='Rain')#df2.plot(y='Rain', kind='box')plt.show()

直方图

df2.plot(y='Rain', kind='hist')#df2.plot.hist(y='Rain')plt.show()

纵坐标的刻度可以通过bins设置

df2.plot(y='Rain', kind='hist', bins=[0,25,50,75,100,125,150,175, 200])#df2.plot.hist(y='Rain')plt.show()

多图并存

df.plot(kind='line',         y=['Tmax', 'Tmin', 'Rain', 'Sun'], #4个变量可视化         subplots=True,   #多子图并存         layout=(2, 2),   #子图排列2行2列         figsize=(20, 10)) #图布的尺寸plt.show()

df.plot(kind='bar',         y=['Tmax', 'Tmin', 'Rain', 'Sun'], #4个变量可视化         subplots=True,   #多子图并存         layout=(2, 2),   #子图排列2行2列         figsize=(20, 10)) #图布的尺寸plt.show()

加标题

给可视化起个标题

df.plot(kind='bar',         y=['Tmax', 'Tmin'], #2个变量可视化         subplots=True,   #多子图并存         layout=(1, 2),   #子图排列1行2列         figsize=(20, 5),#图布的尺寸         title='The Weather of London')  #标题plt.show()

保存结果

可视化的结果可以存储为图片文件

df.plot(kind='pie', y='Rain', legend=False, figsize=(10, 5), title='Pie of Weather in London')plt.savefig('img/pie.png')plt.show()

df.plot更多参数

df.plot(x, y, kind, figsize, title, grid, legend, style)

  • x 只有dataframe对象时,x可用。横坐标

  • y 同上,纵坐标变量

  • kind 可视化图的种类,如line,hist, bar, barh, pie, kde, scatter

  • figsize 画布尺寸

  • title 标题

  • grid 是否显示格子线条

  • legend 是否显示图例

  • style 图的风格

查看plot参数可以使用help

import pandas as pdhelp(pd.DataFrame.plot)

End.

来源:大邓和他的Python

推荐阅读

腾讯视频 Python 爬虫项目实战

推荐 13 个 Python 新手练级项目

Python 从业十年是种什么体验?

干货 | 18个 Python 高效编程技巧

写出一手Python烂代码的 19 条准则

最强编辑器 PyCharm 最全使用指南!

机器学习训练秘籍(完整中文版)PDF下载

4个Python实战项目,让你瞬间读懂Python!

1年工作经验,拿下今日头条 Python 开发面经分享

扫码关注,

每晚八点,Python日报,不见不散!

python pandas_Python库Pandas数据可视化实战案例相关推荐

  1. Python库Pandas数据可视化实战案例

    >关注公众号:大数据技术派,回复`资料`,领取`1024G`资料. 数据可视化可以让我们很直观的发现数据中隐藏的规律,察觉到变量之间的互动关系,可以帮助我们更好的给他人解释现象,做到一图胜千文的 ...

  2. 【Python网络爬虫与数据可视化实战案例】近15年的中国国内生产总值

    需求描述   打开东方财富网的中国国内数据总值数据页,进入如下页面.   现在需要把页面上的国内生产总值数据表爬取下来,写入CSV文件以持久化存储.在这之后,将CSV文件内的数据做成折线图,实现数据可 ...

  3. 【Python网络爬虫与数据可视化实战案例】未来15天气温走势图

    需求描述   打开天气网,点击上方城市名称,再点击"15天天气",进入如下页面.这里以天津为例.   可以看到,这里是有未来15天的天气和气温状况的.我们要做的就是把每天的最高和最 ...

  4. 【Python基础】Pandas数据可视化原来也这么厉害

    一.可视化概述 在Python中,常见的数据可视化库有3个: matplotlib:最常用的库,可以算作可视化的必备技能库,比较底层,api多,学起来不太容易. seaborn:是建构于matplot ...

  5. pandas to_csv参数详解_【Python基础】Pandas数据可视化原来也这么厉害

    一.可视化概述 在Python中,常见的数据可视化库有3个: matplotlib:最常用的库,可以算作可视化的必备技能库,比较底层,api多,学起来不太容易. seaborn:是建构于matplot ...

  6. Python Bokeh 库进行数据可视化实用指南

    写在前面 我相信大家已经阅读了不少有关"机器学习"."数据科学家"."数据可视化"等话题的文章.有些人将数据科学称为 21 世纪最性感的工作 ...

  7. 数据分析从零到精通第三课 python自动化和BI数据可视化实战

    05 效率提升:如何通过邮件报表释放人力 本课时主要分享从零搭建数据邮件日报系统的方法,从而满足业务方的定期数据需求.希望通过本课时的介绍,你可以立刻在自己机器上实践定时邮件发送的任务. 邮件日报的业 ...

  8. 【Python】京东消费行为数据分析可视化实战案例

    ©️数据STUDIO投稿 · 作者|理智 一.背景 京东JD.COM-专业综合网上购物商城,销售超数万品牌,4020万种商品,囊括家电.手机.电脑.服装.居家.健康.母婴.美妆.个护.食品.旅游等品类 ...

  9. Python数据可视化实战——iris数据集可视化

    首先,这个Python数据可视化实战是在Iris数据集上完成的.所使用的是Python 3环境下的jupyter notebook. 实战中我们需要用到的库包括:pandas , matplotlib ...

最新文章

  1. 如何解决XML文件中的警告提示“No grammar constraints (DTD or XML Schema) referenced in the document.”...
  2. 编程方法学4:计算机科学发展简史
  3. android sqlite触发器,SQLite---使用触发器(Trigger)
  4. 程序员面试金典 - 面试题 17.13. 恢复空格(DP+Trie树)
  5. C语言 strlen 函数 - C语言零基础入门教程
  6. 邮件营销的三个基本要素讲解
  7. 如何使用SSH密钥登录你的云服务器?使用SSH密钥的好处
  8. 【学堂在线数据挖掘:理论方法笔记】第l六天(3.31)
  9. .NET(c#) 移动APP开发平台之Smobiler开发
  10. 关于sentaurus使用感
  11. vue 怎么解析xml
  12. WORKBENCHSCDM导入CAD文件报错?
  13. 微信小程序echarts问题整理与解决
  14. DirectX显示流程学习小结
  15. 司马相如和卓文君——野史+臆想
  16. android 创建多级目录,Android创建文件夹
  17. Word排版-页眉上的横线
  18. 中国信号调理器行业市场供需与战略研究报告
  19. 优锘科技:企业架构管理平台荣获2021年度创新产品奖
  20. pyqt任务栏图标问题

热门文章

  1. 在CentOS 6.9 x86_64的nginx 1.12.2上开启ngx_http_geo_module模块实录
  2. 京东广告典型源码示例二
  3. 藤摇椅游戏道具制作全流程讲解视频教程
  4. c潭州课堂25班:Ph201805201 MySQL第二课 (课堂笔记)
  5. svn 提交信息模板
  6. 简谈 Java 中的泛型通配符
  7. Android学习笔记进阶十一图片动画播放(AnimationDrawable)
  8. iOS开发 - 线程与进程的认识与理解
  9. enumeration学习
  10. [mongodb翻译]选择合适的shard key