作者:Costas Andreou机器之心编译参与:Jamin、张倩在读技术博客的过程中,我们会发现那些能够把知识、成果讲透的博主很多都会做动态图表。他们的图是怎么做的?难度大吗?这篇文章就介绍了 Python 中一种简单的动态图表制作方法。

数据暴增的年代,数据科学家、分析师在被要求对数据有更深的理解与分析的同时,还需要将结果有效地传递给他人。如何让目标听众更直观地理解?当然是将数据可视化啊,而且最好是动态可视化。本文将以线型图、条形图和饼图为例,系统地讲解如何让你的数据图表动起来。

这些动态图表是用什么做的?接触过数据可视化的同学应该对 Python 里的 Matplotlib 库并不陌生。它是一个基于 Python 的开源数据绘图包,仅需几行代码就可以帮助开发者生成直方图、功率谱、条形图、散点图等。这个库里有个非常实用的扩展包——FuncAnimation,可以让我们的静态图表动起来。FuncAnimation 是 Matplotlib 库中 Animation 类的一部分,后续会展示多个示例。如果是首次接触,你可以将这个函数简单地理解为一个 While 循环,不停地在 “画布” 上重新绘制目标数据图。如何使用 FuncAnimation?这个过程始于以下两行代码:import matplotlib.animation as anianimator = ani.FuncAnimation(fig, chartfunc, interval = 100)从中我们可以看到 FuncAnimation 的几个输入:fig 是用来 「绘制图表」的 figure 对象;

chartfunc 是一个以数字为输入的函数,其含义为时间序列上的时间;

interval 这个更好理解,是帧之间的间隔延迟,以毫秒为单位,默认值为 200。这是三个关键输入,当然还有更多可选输入,感兴趣的读者可查看原文档,这里不再赘述。下一步要做的就是将数据图表参数化,从而转换为一个函数,然后将该函数时间序列中的点作为输入,设置完成后就可以正式开始了。在开始之前依旧需要确认你是否对基本的数据可视化有所了解。也就是说,我们先要将数据进行可视化处理,再进行动态处理。按照以下代码进行基本调用。另外,这里将采用大型流行病的传播数据作为案例数据(包括每天的死亡人数)。import matplotlib.animation as aniimport matplotlib.pyplot as pltimport numpy as npimport pandas as pdurl = 'https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_covid19_deaths_global.csv'df = pd.read_csv(url, delimiter=',', header='infer')df_interest = df.loc[    df['Country/Region'].isin(['United Kingdom', 'US', 'Italy', 'Germany'])    & df['Province/State'].isna()]df_interest.rename(    index=lambda x: df_interest.at[x, 'Country/Region'], inplace=True)df1 = df_interest.transpose()df1 = df1.drop(['Province/State', 'Country/Region', 'Lat', 'Long'])df1 = df1.loc[(df1 != 0).any(1)]df1.index = pd.to_datetime(df1.index)绘制三种常见动态图表绘制动态线型图

如下所示,首先需要做的第一件事是定义图的各项,这些基础项设定之后就会保持不变。它们包括:创建 figure 对象,x 标和 y 标,设置线条颜色和 figure 边距等:import numpy as npimport matplotlib.pyplot as pltcolor = ['red', 'green', 'blue', 'orange']fig = plt.figure()plt.xticks(rotation=45, ha="right", rotation_mode="anchor") #rotate the x-axis valuesplt.subplots_adjust(bottom = 0.2, top = 0.9) #ensuring the dates (on the x-axis) fit in the screenplt.ylabel('No of Deaths')plt.xlabel('Dates')接下来设置 curve 函数,进而使用 .FuncAnimation 让它动起来:def buildmebarchart(i=int):    plt.legend(df1.columns)    p = plt.plot(df1[:i].index, df1[:i].values) #note it only returns the dataset, up to the point i    for i in range(0,4):        p[i].set_color(color[i]) #set the colour of each curveimport matplotlib.animation as anianimator = ani.FuncAnimation(fig, buildmebarchart, interval = 100)plt.show()动态饼状图

可以观察到,其代码结构看起来与线型图并无太大差异,但依旧有细小的差别。import numpy as npimport matplotlib.pyplot as pltfig,ax = plt.subplots()explode=[0.01,0.01,0.01,0.01] #pop out each slice from the piedef getmepie(i):    def absolute_value(val): #turn % back to a number        a  = np.round(val/100.*df1.head(i).max().sum(), 0)        return int(a)    ax.clear()    plot = df1.head(i).max().plot.pie(y=df1.columns,autopct=absolute_value, label='',explode = explode, shadow = True)    plot.set_title('Total Number of Deaths\n' + str(df1.index[min( i, len(df1.index)-1 )].strftime('%y-%m-%d')), fontsize=12)import matplotlib.animation as anianimator = ani.FuncAnimation(fig, getmepie, interval = 200)plt.show()主要区别在于,动态饼状图的代码每次循环都会返回一组数值,但在线型图中返回的是我们所在点之前的整个时间序列。返回时间序列通过 df1.head(i) 来实现,而. max()则保证了我们仅获得最新的数据,因为流行病导致死亡的总数只有两种变化:维持现有数量或持续上升。df1.head(i).max()动态条形图创建动态条形图的难度与上述两个案例并无太大差别。在这个案例中,作者定义了水平和垂直两种条形图,读者可以根据自己的实际需求来选择图表类型并定义变量栏。fig = plt.figure()bar = ''def buildmebarchart(i=int):    iv = min(i, len(df1.index)-1) #the loop iterates an extra one time, which causes the dataframes to go out of bounds. This was the easiest (most lazy) way to solve this :)    objects = df1.max().index    y_pos = np.arange(len(objects))    performance = df1.iloc[[iv]].values.tolist()[0]    if bar == 'vertical':        plt.bar(y_pos, performance, align='center', color=['red', 'green', 'blue', 'orange'])        plt.xticks(y_pos, objects)        plt.ylabel('Deaths')        plt.xlabel('Countries')        plt.title('Deaths per Country \n' + str(df1.index[iv].strftime('%y-%m-%d')))    else:        plt.barh(y_pos, performance, align='center', color=['red', 'green', 'blue', 'orange'])        plt.yticks(y_pos, objects)        plt.xlabel('Deaths')        plt.ylabel('Countries')animator = ani.FuncAnimation(fig, buildmebarchart, interval=100)plt.show()在制作完成后,存储这些动态图就非常简单了,可直接使用以下代码:animator.save(r'C:\temp\myfirstAnimation.gif')感兴趣的读者如想获得详细信息可参考:https://matplotlib.org/3.1.1/api/animation_api.html。原文链接:https://towardsdatascience.com/learn-how-to-create-animated-graphs-in-python-fce780421afe

分享Python&AI,等互联网干货,点亮在看

python函数ppt_如何用 Python 让你的PPT数据动起来相关推荐

  1. chatgpt赋能python:Python迭代:如何用Python迭代优化你的程序?

    Python 迭代:如何用 Python 迭代优化你的程序? 引言 Python 是一门强大的编程语言,在科学计算.数据分析.Web 开发.人工智能等领域都得到了广泛的应用.其中,Python 的迭代 ...

  2. Python 函数声明和调用 - Python零基础入门教程

    目录 一.前言 二.Python 函数定义 三.Python 函数的调用 四.Python 函数传参 1.Python 函数常规参数 2.Python 函数缺省参数 3.Python 函数不定长参数 ...

  3. python判断素数的函数_如何用python求素数

    如何用python求100以内的素数? 质数(primenumber)又称素数,有无限个.质数定义为在大于1的自然数中,除了1和它本身以外不再有其他因数的数称为质数,如:2.3.5.7.11.13.1 ...

  4. python求素数的函数_如何用python求素数

    如何用python求100以内的素数? 质数(primenumber)又称素数,有无限个.质数定义为在大于1的自然数中,除了1和它本身以外不再有其他因数的数称为质数,如:2.3.5.7.11.13.1 ...

  5. python读数据-如何用Python读取开放数据?

    当你开始接触丰富多彩的开放数据集时,CSV.JSON和XML等格式名词就会奔涌而来.如何用Python高效地读取它们,为后续的整理和分析做准备呢?本文为你一步步展示过程,你自己也可以动手实践. 需求 ...

  6. python爬虫图片-如何用Python来制作简单的爬虫,爬取到你想要的图片

    原标题:如何用Python来制作简单的爬虫,爬取到你想要的图片 在我们日常上网浏览网页的时候,经常会看到一些好看的图片,我们就希望把这些图片保存下载,或者用户用来做桌面壁纸,或者用来做设计的素材. 我 ...

  7. python读数据-如何用 Python 读取数据?

    原标题:如何用 Python 读取数据? 这是林骥的第 36 篇文章 1. 序言 读取数据往往是做数据分析的第一步,本文没有讲那些艰涩难懂的概念,只有一些问题的解决方案,当你遇到类似的问题的时候,可以 ...

  8. 如何自学python数据分析-Python学习干货 |如何用Python进行数据分析?

    为什么选择Python进行数据分析? Python是一门动态的.面向对象的脚本语言,同时也是一门简约,通俗易懂的编程语言.Python入门简单,代码可读性强,一段好的Python代码,阅读起来像是在读 ...

  9. python怎么用交互式界面_交互式python教程_如何用python做交互式界面

    什么叫做交互式python解释器 个例子来说明交互式解释  (看看 Onion - 老杨 解释的内容如下) 例: 创建文件 zoo.py.在该文件义函数 hours(),输出字符串'Open 9-5 ...

最新文章

  1. ORACLE导入TXT文件数据的解决思路
  2. 程序员面试题精选100题(20)-最长公共子串[算法]
  3. delphi 常用属性/方法《转》
  4. SQL2005 express升级到2008企业版解决4096限制问题
  5. linux中xjvf指令,linux解压缩命令小结
  6. 财务管理专业应该报计算机二级哪个科目,我是应该报计算机二级还是三级呢
  7. asp.net winform 实现复制,粘贴,剪切功能
  8. 分布式系统架构的基本原则和实践
  9. 真不好意思,关于小猪妹(妖精)的
  10. ASP.NET之MVC 微信公众号授权给第三方平台的技术实现流程一(获取第三方平台access_token)...
  11. JavaScript的API设计原则
  12. 【原创】大叔算法分享(6)机器学习概览
  13. dell电脑如何安装ubuntu系统_如何在 Dell PC 上安装 Ubuntu Linux
  14. 快手,抖音,美拍打造个人IP精准引流!
  15. OSChina 周五乱弹 ——电影里有在线/离线,递归,循环,矩阵等概念?
  16. htmlunit+quartz定时抓取博文并生成jsp页面
  17. js 递归树根据子节点获取所有父节点
  18. 开源J2EE项目Zheng环境Docker部署
  19. 防止Form表单重复提交的客户端及服务器端的方式
  20. Android监听按键锁屏广播

热门文章

  1. 9款用HTML5/CSS3制作的动物、人物动画
  2. 详解Decorator模式和vistor模式
  3. Angular 4入门教程系列:14:PrimeNG的使用方式
  4. 2019丘成桐中学科学奖计算机,2019年丘成桐中学科学奖总决赛获奖名单
  5. html5 contenteditable 可编辑属性
  6. 【官方文档】Fluent Bit 数据管道之输入插件(Tail)
  7. 【爱思考】CISP证书有效期是几年,到期后怎么办
  8. cdr文字内容显示不出来_cdr中字体预览不显示 字体安装后cdr不显示
  9. 关于智能水表背后的“节水效应”
  10. 第五人格显示服务器维护中请稍后登录怎么办,第五人格账号登录失败怎么办