来源:机器之心

原文链接:https://towardsdatascience.com/learn-how-to-create-animated-graphs-in-python-fce780421afe

在读技术博客的过程中,我们会发现那些能够把知识、成果讲透的博主很多都会做动态图表。他们的图是怎么做的?难度大吗?这篇文章就介绍了 Python 中一种简单的动态图表制作方法。

数据暴增的年代,数据科学家、分析师在被要求对数据有更深的理解与分析的同时,还需要将结果有效地传递给他人。如何让目标听众更直观地理解?当然是将数据可视化啊,而且最好是动态可视化。本文将以线型图、条形图和饼图为例,系统地讲解如何让你的数据图表动起来

这些动态图表是用什么做的?接触过数据可视化的同学应该对 Python 里的 Matplotlib 库并不陌生。它是一个基于 Python 的开源数据绘图包,仅需几行代码就可以帮助开发者生成直方图、功率谱、条形图、散点图等。这个库里有个非常实用的扩展包——FuncAnimation,可以让我们的静态图表动起来。FuncAnimation 是 Matplotlib 库中 Animation 类的一部分,后续会展示多个示例。如果是首次接触,你可以将这个函数简单地理解为一个 While 循环,不停地在 “画布” 上重新绘制目标数据图。如何使用 FuncAnimation?这个过程始于以下两行代码:

import matplotlib.animation as ani

animator = ani.FuncAnimation(fig, chartfunc, interval = 100)

从中我们可以看到 FuncAnimation 的几个输入:

  • fig 是用来 「绘制图表」的 figure 对象;

  • chartfunc 是一个以数字为输入的函数,其含义为时间序列上的时间;

  • interval 这个更好理解,是帧之间的间隔延迟,以毫秒为单位,默认值为 200。

这是三个关键输入,当然还有更多可选输入,感兴趣的读者可查看原文档,这里不再赘述。下一步要做的就是将数据图表参数化,从而转换为一个函数,然后将该函数时间序列中的点作为输入,设置完成后就可以正式开始了。在开始之前依旧需要确认你是否对基本的数据可视化有所了解。也就是说,我们先要将数据进行可视化处理,再进行动态处理。按照以下代码进行基本调用。另外,这里将采用大型流行病的传播数据作为案例数据(包括每天的死亡人数)。

import matplotlib.animation as aniimport matplotlib.pyplot as pltimport numpy as npimport pandas as pdurl = 'https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_covid19_deaths_global.csv'df = pd.read_csv(url, delimiter=',', header='infer')df_interest = df.loc[    df['Country/Region'].isin(['United Kingdom', 'US', 'Italy', 'Germany'])    & df['Province/State'].isna()]df_interest.rename(    index=lambda x: df_interest.at[x, 'Country/Region'], inplace=True)df1 = df_interest.transpose()df1 = df1.drop(['Province/State', 'Country/Region', 'Lat', 'Long'])df1 = df1.loc[(df1 != 0).any(1)]df1.index = pd.to_datetime(df1.index)

绘制三种常见动态图表动态曲线图

如下所示,首先需要做的第一件事是定义图的各项,这些基础项设定之后就会保持不变。它们包括:创建 figure 对象,x 标和 y 标,设置线条颜色和 figure 边距等:

import numpy as npimport matplotlib.pyplot as pltcolor = ['red', 'green', 'blue', 'orange']fig = plt.figure()plt.xticks(rotation=45, ha="right", rotation_mode="anchor") #rotate the x-axis valuesplt.subplots_adjust(bottom = 0.2, top = 0.9) #ensuring the dates (on the x-axis) fit in the screenplt.ylabel('No of Deaths')plt.xlabel('Dates')

接下来设置 curve 函数,进而使用 .FuncAnimation 让它动起来:

def buildmebarchart(i=int):    plt.legend(df1.columns)    p = plt.plot(df1[:i].index, df1[:i].values) #note it only returns the dataset, up to the point i    for i in range(0,4):        p[i].set_color(color[i]) #set the colour of each curveimport matplotlib.animation as anianimator = ani.FuncAnimation(fig, buildmebarchart, interval = 100)plt.show()

动态饼状图

可以观察到,其代码结构看起来与线型图并无太大差异,但依旧有细小的差别。

import numpy as npimport matplotlib.pyplot as pltfig,ax = plt.subplots()explode=[0.01,0.01,0.01,0.01] #pop out each slice from the piedef getmepie(i):    def absolute_value(val): #turn % back to a number        a  = np.round(val/100.*df1.head(i).max().sum(), 0)        return int(a)    ax.clear()    plot = df1.head(i).max().plot.pie(y=df1.columns,autopct=absolute_value, label='',explode = explode, shadow = True)    plot.set_title('Total Number of Deaths\n' + str(df1.index[min( i, len(df1.index)-1 )].strftime('%y-%m-%d')), fontsize=12)import matplotlib.animation as anianimator = ani.FuncAnimation(fig, getmepie, interval = 200)plt.show()

主要区别在于,动态饼状图的代码每次循环都会返回一组数值,但在线型图中返回的是我们所在点之前的整个时间序列。返回时间序列通过 df1.head(i) 来实现,而. max()则保证了我们仅获得最新的数据,因为流行病导致死亡的总数只有两种变化:维持现有数量或持续上升。

df1.head(i).max()

动态条形图创建动态条形图的难度与上述两个案例并无太大差别。在这个案例中,作者定义了水平和垂直两种条形图,读者可以根据自己的实际需求来选择图表类型并定义变量栏。

fig = plt.figure()bar = ''def buildmebarchart(i=int):    iv = min(i, len(df1.index)-1) #the loop iterates an extra one time, which causes the dataframes to go out of bounds. This was the easiest (most lazy) way to solve this :)    objects = df1.max().index    y_pos = np.arange(len(objects))    performance = df1.iloc[[iv]].values.tolist()[0]    if bar == 'vertical':        plt.bar(y_pos, performance, align='center', color=['red', 'green', 'blue', 'orange'])        plt.xticks(y_pos, objects)        plt.ylabel('Deaths')        plt.xlabel('Countries')        plt.title('Deaths per Country \n' + str(df1.index[iv].strftime('%y-%m-%d')))    else:        plt.barh(y_pos, performance, align='center', color=['red', 'green', 'blue', 'orange'])        plt.yticks(y_pos, objects)        plt.xlabel('Deaths')        plt.ylabel('Countries')animator = ani.FuncAnimation(fig, buildmebarchart, interval=100)plt.show()

保存动画图在制作完成后,存储这些动态图就非常简单了,可直接使用以下代码:

animator.save(r'C:\temp\myfirstAnimation.gif')

感兴趣的读者如想获得详细信息可参考https://matplotlib.org/3.1.1/api/animation_api.html。

python绘制pr曲线图_如何利用Python制作可以动的动态图表。相关推荐

  1. python绘制pr曲线图_利用Python中的numpy包实现PR曲线和ROC曲线的计算!

    闲来无事,边理解PR曲线和ROC曲线,边写了一下计算两个指标的代码.在python环境下,sklearn里有现成的函数计算ROC曲线坐标点,这里为了深入理解这两个指标,写代码的时候只用到numpy包. ...

  2. python绘制pr曲线图_在张力板上显示PR曲线

    我试图用tensorflow和tensorboard来显示地图或精确的响应曲线.目前我有一个tensorboard显示我的accuracy,precision,f-score,和{},用于epoch的 ...

  3. 用python绘制心形_如何利用Python绘制一个爱心

    刚学习Python几周,闲来无事,突然想尝试画一个爱心,步骤如下: 打开界面 打开Python shell界面,具体是Python语言的IDLE软件脚本. 2.建立脚本 单击左上角'File',再单击 ...

  4. python绘制三维曲线图_机器学习的绘图库有哪些?如何运用python绘制机器学习常见曲线?...

    专栏引荐 绘图的变量 单变量 查看单变量最方便的无疑是displot()函数,默许绘制一个直方图,并你核密度估计(KDE) sns.set(color_codes=True) np.random.se ...

  5. 如何用python进行相关性分析_如何利用python进行时间序列分析

    题记:毕业一年多天天coding,好久没写paper了.在这动荡的日子里,也希望写点东西让自己静一静.恰好前段时间用python做了一点时间序列方面的东西,有一丁点心得体会想和大家分享下.在此也要特别 ...

  6. python编程应用中级_如何利用Python辅助开发HSK中级课程-数据统计篇

    HSK中级(4级)课程的开发难度比1-3级大上许多.原因主要有:生词量翻倍:3级是300个新增词,4级是600个新增词(脑容量明显不够了) 语法数量猛增:3级的语法数量在50左右,而4级的语法数量,基 ...

  7. python绘制混淆矩阵_如何实现python绘制混淆矩阵?

    大家从python基础到如今的入门,想必都对python有一定基础,今天小编给大家带来一个关于python的高阶内容--绘制混淆矩阵,一起来看下吧~ 介绍: 混淆矩阵通过表示正确/不正确标签的计数来表 ...

  8. python如何画曲线图_如何使用python画曲线图

    如何使用python画曲线图?下面是基本步骤: 前提 首先,为了实际使用 Matplotlib,我们需要安装它. 安装 如果你安装了更高版本的 Python,你应该能够打开cmd.exe或终端,然后执 ...

  9. 如何用python修改pdf内容_如何利用python将pdf文件转化为txt文件?

    https://www.wukong.com/answer/6579491774144708872/?iid=15906422033&app=news_article&share_an ...

最新文章

  1. canvas知识点总结2
  2. 网页的一般布局(标题和脚注100%,内容宽度固定宽度px)
  3. Logistic Regression 模型简介
  4. 阈值Java_亲测有效!一种完美动态阈值白平衡算法 Java实现。
  5. C++ 类模板四(typename关键字)
  6. java sleep join_Java多線程之sleep,wait,join和yield關鍵字
  7. C语言字符串是否为pallindrome排列的算法(附完整源码)
  8. 爬取json Swaggerui界面
  9. Lua中的metatable
  10. Anti-alias的前世今生(二):Post process based AA
  11. 【脱壳-寻找OEP】通过堆栈平衡法找到OEP(ESP定律)
  12. windows/ubuntu系统下安装teamview教程
  13. 单应性变换 Homography Estimation
  14. DW2019HTML中没有文本对象,Dreamweaver CC2019文字或图片添加空连接方法
  15. Maya动画后期——粒子特效的制作
  16. C#中路径表示\ 和 /
  17. 性能强大的家庭服务器,家庭服务器解决方案——硬件篇
  18. 几种常用的特征选择方法
  19. Python实现各种加密,接口加解密不说难
  20. self-attention

热门文章

  1. 侦听127.0.01_Spring 4.2中由注释驱动的事件侦听器
  2. jooq_jOOQ与Hibernate:何时选择哪个
  3. lambda捕获this_非捕获Lambda的实例
  4. 使用Java从地图中删除元素
  5. 宣布EAXY:使Java中的XML更容易
  6. MongoDB初学者教程
  7. Neo4j:Cypher – Neo.ClientError.Statement.TypeError:不知道如何添加Double和String
  8. 使用JUnit 5进行更清洁的参数化测试
  9. JavaFX动画工具
  10. 创建示例HTTPS服务器以获取乐趣和收益