作者:ostas Andreou

源自:机器之心

看这优美的舞姿

数据暴增的年代,数据科学家、分析师在被要求对数据有更深的理解与分析的同时,还需要将结果有效地传递给他人。如何让目标听众更直观地理解?当然是将数据可视化啊,而且最好是动态可视化。

本文将以线型图、条形图和饼图为例,系统地讲解如何让你的数据图表动起来

这些动态图表是用什么做的?

接触过数据可视化的同学应该对 Python 里的 Matplotlib 库并不陌生。它是一个基于 Python 的开源数据绘图包,仅需几行代码就可以帮助开发者生成直方图、功率谱、条形图、散点图等。这个库里有个非常实用的扩展包——FuncAnimation,可以让我们的静态图表动起来。

FuncAnimation 是 Matplotlib 库中 Animation 类的一部分,后续会展示多个示例。如果是首次接触,你可以将这个函数简单地理解为一个 While 循环,不停地在 “画布” 上重新绘制目标数据图。

如何使用 FuncAnimation?

这个过程始于以下两行代码:

import matplotlib.animation as anianimator = ani.FuncAnimation(fig, chartfunc, interval = 100)

从中我们可以看到 FuncAnimation 的几个输入:

  • fig 是用来 「绘制图表」的 figure 对象;

  • chartfunc 是一个以数字为输入的函数,其含义为时间序列上的时间;

  • interval 这个更好理解,是帧之间的间隔延迟,以毫秒为单位,默认值为 200。

这是三个关键输入,当然还有更多可选输入,感兴趣的读者可查看原文档,这里不再赘述。

下一步要做的就是将数据图表参数化,从而转换为一个函数,然后将该函数时间序列中的点作为输入,设置完成后就可以正式开始了。

在开始之前依旧需要确认你是否对基本的数据可视化有所了解。也就是说,我们先要将数据进行可视化处理,再进行动态处理。

按照以下代码进行基本调用。另外,这里将采用大型流行病的传播数据作为案例数据(包括每天的死亡人数)。

import matplotlib.animation as ani
import matplotlib.pyplot as plt
import numpy as np
import pandas as pdurl = 'https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_covid19_deaths_global.csv'
df = pd.read_csv(url, delimiter=',', header='infer')df_interest = df.loc[df['Country/Region'].isin(['United Kingdom', 'US', 'Italy', 'Germany'])& df['Province/State'].isna()]df_interest.rename(index=lambda x: df_interest.at[x, 'Country/Region'], inplace=True)
df1 = df_interest.transpose()df1 = df1.drop(['Province/State', 'Country/Region', 'Lat', 'Long'])
df1 = df1.loc[(df1 != 0).any(1)]
df1.index = pd.to_datetime(df1.index)

绘制三种常见动态图表

绘制动态线型图

如下所示,首先需要做的第一件事是定义图的各项,这些基础项设定之后就会保持不变。它们包括:创建 figure 对象,x 标和 y 标,设置线条颜色和 figure 边距等:

import numpy as np
import matplotlib.pyplot as pltcolor = ['red', 'green', 'blue', 'orange']
fig = plt.figure()
plt.xticks(rotation=45, ha="right", rotation_mode="anchor") #rotate the x-axis values
plt.subplots_adjust(bottom = 0.2, top = 0.9) #ensuring the dates (on the x-axis) fit in the screen
plt.ylabel('No of Deaths')
plt.xlabel('Dates')

接下来设置 curve 函数,进而使用 .FuncAnimation 让它动起来:

def buildmebarchart(i=int):plt.legend(df1.columns)p = plt.plot(df1[:i].index, df1[:i].values) #note it only returns the dataset, up to the point ifor i in range(0,4):p[i].set_color(color[i]) #set the colour of each curveimport matplotlib.animation as ani
animator = ani.FuncAnimation(fig, buildmebarchart, interval = 100)
plt.show()

动态饼状图

可以观察到,其代码结构看起来与线型图并无太大差异,但依旧有细小的差别。

import numpy as np
import matplotlib.pyplot as pltfig,ax = plt.subplots()
explode=[0.01,0.01,0.01,0.01] #pop out each slice from the piedef getmepie(i):def absolute_value(val): #turn % back to a numbera  = np.round(val/100.*df1.head(i).max().sum(), 0)return int(a)ax.clear()plot = df1.head(i).max().plot.pie(y=df1.columns,autopct=absolute_value, label='',explode = explode, shadow = True)plot.set_title('Total Number of Deaths\n' + str(df1.index[min( i, len(df1.index)-1 )].strftime('%y-%m-%d')), fontsize=12)import matplotlib.animation as ani
animator = ani.FuncAnimation(fig, getmepie, interval = 200)
plt.show()

主要区别在于,动态饼状图的代码每次循环都会返回一组数值,但在线型图中返回的是我们所在点之前的整个时间序列。返回时间序列通过 df1.head(i) 来实现,而. max()则保证了我们仅获得最新的数据,因为流行病导致死亡的总数只有两种变化:维持现有数量或持续上升。

df1.head(i).max()

动态条形图

创建动态条形图的难度与上述两个案例并无太大差别。在这个案例中,作者定义了水平和垂直两种条形图,读者可以根据自己的实际需求来选择图表类型并定义变量栏。

fig = plt.figure()
bar = ''def buildmebarchart(i=int):iv = min(i, len(df1.index)-1) #the loop iterates an extra one time, which causes the dataframes to go out of bounds. This was the easiest (most lazy) way to solve this :)objects = df1.max().indexy_pos = np.arange(len(objects))performance = df1.iloc[[iv]].values.tolist()[0]if bar == 'vertical':plt.bar(y_pos, performance, align='center', color=['red', 'green', 'blue', 'orange'])plt.xticks(y_pos, objects)plt.ylabel('Deaths')plt.xlabel('Countries')plt.title('Deaths per Country \n' + str(df1.index[iv].strftime('%y-%m-%d')))else:plt.barh(y_pos, performance, align='center', color=['red', 'green', 'blue', 'orange'])plt.yticks(y_pos, objects)plt.xlabel('Deaths')plt.ylabel('Countries')animator = ani.FuncAnimation(fig, buildmebarchart, interval=100)plt.show()

在制作完成后,存储这些动态图就非常简单了,可直接使用以下代码:

animator.save(r'C:\temp\myfirstAnimation.gif')

感兴趣的读者如想获得详细信息可参考:https://matplotlib.org/3.1.1/api/animation_api.html。

原文链接:https://towardsdatascience.com/learn-how-to-create-animated-graphs-in-python-fce780421afe

卧槽!​我的Python竟然会跳舞!相关推荐

  1. python使用需要钱吗-万能的Python竟然算不明白“钱”?损失惨重!

    金融行业的同学,经常会遇到"钱"的转换问题,在进行金额的计算和转化时,稍微有不慎,则会损失惨重. 1.带来经济损失,可能比较微小, 2.严重影响了后续的日终对账业务, 3.客户的投 ...

  2. 在鹅厂工作的广西表妹教我用Python生成会跳舞的美女~

    导语 我今年31,没有女朋友,身体健康,性取向正常,不抽烟不喝酒不嫖娼,因为孤身一人在外地,技术宅,圈子又小,所以不知不觉单到现在.相亲的都是老家介绍,网上聊着聊着就没有后续了,所以就像一条咸鱼一样p ...

  3. Python竟然可以画漫画!漫画版的故宫导游图,来袭!

    随着Python编程的应用领域越来越广,从数据分析到人工智能.从机器学习到深度学习.从数据可视化到分析报告,越来领域开始使用Python. 而漫画领域也开始涉及Python,兰道尔·门罗(网名xkcd ...

  4. 一个黑科技,Python竟然可以伪造很多'假'的数据!

    点击上方"菜鸟学Python",选择"星标"公众号 干货第一时间推给你!!! Python里面的库真的太多太多了,各种千奇百怪的都有.今天小编逛GitHub的时 ...

  5. 太实用了!Python竟然能把“长的”变成“短的”!

    人生苦短,菜鸟学Python! 最近我遇到了一些问题:需要将几百条长链接转成短链接.经过一番学习,发现Python可以轻松解决这个问题,不仅可以实现缩短[长链接→短链接],也可以实现还原[短链接→长链 ...

  6. 厉害了,Python竟然也可以制作萌萌的手绘图表

    大家可能已经习惯了用Matplotlib和seaborn来制作不同的图表,但是今天要介绍一个非常酷的Python手绘风格的可视化包:cutecharts. 这个包可以用来生成以下几种看起来像手绘的图表 ...

  7. 666,Python竟然还可以计算农历!

    最近处理工作任务的时候遇到了转换农历的问题.一开始我打算搜索在线处理的网站或者转换的接口,结果找到了一个Python库可以直接解决,今天正好同大家分享一下. 农历,是我国现行的传统历法.它是根据月相的 ...

  8. 卧槽!微软Python入门课居然汉化了!

    去年,微软上线了自己的Python入门课程.一时间,好评如潮.但是真正看完这个课程的国人非常少,因为它的翻译实在是太烂了(英文听力好的人应该看的还是很爽的).很明显,微软直接采用了机器翻译,导致视频的 ...

  9. 王者归来!2020 年 5 月编程语言排行榜,Python竟然排老三

    转载来自:菜鸟教程 TIOBE 2020 年 5 月份的编程语言排行榜已经公布,官方的标题是:C 语言排名重新回到第一. Java 和 C 在 4 月份的排名已经非常接近,百分比相差 0.01%: 进 ...

最新文章

  1. 【Unity】使用Resources类管理资源
  2. php自动断词,PHP自动分页、防止英文单词被截段、去除HTML代码
  3. 题目1128:求平均年龄
  4. 多个类的DLL封装及调用
  5. centos刻录工具_centos u盘引导制作工具下载|
  6. python 标准差内数据概率怎么求_Python-统计概率
  7. three.js加载3d模型_可加载5亿多边形,InsiteVR推Quest端BIM协作应用《Resolve》
  8. 【js】获得项目路径
  9. html5与跨平台开发,HTML5应用与跨平台应用开发
  10. Chrome浏览器调试踩坑
  11. mysql 表死锁_为什么说 MySQL 的表锁不会产生死锁
  12. 程序员遇到bug时常见的30种反应
  13. 【Flink】Flink SQL 架构 以及 执行逻辑
  14. 02_感知机_统计学习方法
  15. 基于MapGuide的在线WebGIS站点介绍
  16. 用直接分解法求方程组的C语言程序,LU分解法解线性方程组(C语言)
  17. HTG评论Yoga Tablet 2 Pro:内置Pico投影仪可延长电池寿命
  18. cinta作业5:循环群
  19. 拉格朗日乘数法 和 KTT条件
  20. 怎样快速制作GIF动图?教你一分钟在线制作GIF

热门文章

  1. [游戏开发]手机发热问题总结
  2. 易宝典——体验O365中的Teams 实验手册之五 移动应用客户端体验
  3. jqgrid实现多级表头
  4. 关于信号上升时间和传输延时的关系
  5. python ADB 手机屏幕 控制脚本 刷粉 刷赞 脚本
  6. 新点软件登陆科创板:上市首日破发,腾讯、建发股份参与认购
  7. Notepad++ 添加右键菜单
  8. redis源码阅读-zset
  9. IBM SPSS MODELER --时间序列建模
  10. mlf机器人无限制格斗_2017年无限制机器人格斗职业联赛MLF广州站暨FMB世界杯热身赛圆满落幕...