前文的两个案例虽用的都是虚拟数据集,但都有一定的针对性,案例 水果分类(香蕉、苹果大战) 中,讨论了一个分类问题,并对散点图、直方图、箱线图和等比例子图的应用做了探讨;案例 多元线性回归 中,讨论了一个回归问题,并对散点图能最大限度可视化数据的维度做了探讨;以上案例涉及算法的部分,如有难度,可自行忽略,因为本系列主要是针对可视化的,案例的目的是为了赋予一个场景,方便对可视化内容的直观理解。

本文通过复现1张学术论文图及3张商业周刊图,加深对面积图、折线图、填充图等绘图对象及不等比例子图、栅格子图合并内容的理解。

涉及到的绘图对象传送门:

折线图、面积图、填充图

涉及到的子图内容传送门:

不等比例栅格子图

子图对象(坐标轴、刻度、轴标题)设置

本文的运行环境为 jupyter notebook

python版本为3.7

本文所用到的库包括

%matplotlib inline
from matplotlib.ticker import AutoMinorLocator
from matplotlib.gridspec import GridSpec
import matplotlib.pyplot as plt
import pandas as pd
import numpy as np

复现图表简介

案例一来源于一篇学术论文:

参考文献

PRABHU T S, FLORIAN M, THIJS V, et al. Optimizer benchmarking needs to account for hyperparameter tuning[J]. arXiv Preprint arXiv, 2019.

该论文研究了超参数优化资源投入影响优化器的性能。作者展示了各优化器下,超参数优化资源投入与找到优化器超参数配置概率的关系。通过图表可以发现,投入越高,调优更多的超参数就越有用。

案例二、三、四均来源于《图表之道》列举的商业周刊的典型图表,刘万祥老师通过Excel单元格和图对象的巧妙组合,复现了以下3张图,因matplotlib没有单元格,因此涉及到的部分采用不等比例的栅格子图进行行高和列宽地调节,达到了相同的效果。

以下绘图内容如在手机端阅读,或许会因长宽比例缩放问题造成比例不协调,还望多理解

案例一

构造数据集

因我们无法获得论文中的具体数据,因此仍然采用人工构造的方法进行数据生成,观察原论文的数据变化趋势,类似sigmoid函数,因此采用sigmoid函数和正太分布的噪音进行数据集的构造。

matplotlib非常适用于学术论文图的绘制,但即使如此,缺省状态绘制的图仍然是不那么美观的,需要不断地修饰以获得一定的美感。

x = np.linspace(0, 64, 65)def sig_array(start, end, size):z = np.linspace(0, size, size)sig = 1/(1+np.exp(-1*z))   # 0.5-1sigA = (sig-sig.min())/(sig.max()-sig.min())  # 0-1sigA = sigA*(end-start)+start   # start-endreturn sigAnoise = np.append(np.random.normal(size=64)/300, [0.0])
y1 = sig_array(0.4, 0.58, 65)+noise
y2 = sig_array(0.2, 0.17, 65)+noise
y3 = sig_array(0.2, 0.13, 65)+noise
y4 = 1-(y1+y2+y3)ys = [y1, y2, y3, y4]
y_stack = y1
for i, y in enumerate(ys):if i > 0:y_stack += yplt.plot(x, y_stack)

以下过程分步地演示了绘制目标图的步骤:

绘制面积图

########################前序代码省略###############################fig=plt.figure(figsize=(9,5.5))
ax=fig.add_subplot(111)span=1.02 # 为右侧辅助线预留空间
colors=['#99C8DE','#006EA8','#AADA86','#2C9633']
ax.stackplot(x,y1,y2,y3,y4,colors=colors,edgecolor='white',lw=2.5)
ax.set_xlim((0,64*span))
ax.set_ylim((0,1))

绘制右侧辅助线

右侧辅助线共分为四段,有三个不连续部分。通过**plt.axvline(ax.axvline)**接口实现分段线地绘制。

########################前序代码省略###############################blank_white = 0.015
ymins = np.array([0,   0.58+blank_white,      0.58+0.17 +blank_white,      0.58+0.17+0.13+blank_white])
ymaxs = np.array([0.58-blank_white, 0.58+0.17-blank_white,0.58+0.17+0.13-blank_white, 1])
line_x_pos = 63.6*span
for ymin, ymax in zip(ymins, ymaxs):ax.axvline(x=line_x_pos, ymin=ymin, ymax=ymax, lw=4, c='gray')

绘制文本

########################前序代码省略###############################poss = np.array([0.58, 0.17, 0.13, 0.12])
optims = ['Adam (only l.r. tuned)','Adam (all params. tuned)','SGD (tuned l.r., fixed mom. and w.d.)','SGD (l.r. schedule tuned, fixed mom. and w.d.)'
]
fmt = ' %.0f%%'
xmax = 64*span  # span=1.02
fontdict = {'family': 'Times New Roman', 'size': 18}
for i, pos in enumerate(poss):if i == 0:ax.text(x=xmax, y=0.5*pos, s=fmt % (pos*100),ha='left', c='gray', va='center', **fontdict)ax.text(x=xmax-2, y=0.5*pos,s=optims[i], ha='right', va='center', **fontdict)else:ax.text(x=xmax, y=(0.5*pos+poss[:i].sum()), s=fmt %(pos*100), ha='left', c='gray', va='center', **fontdict)ax.text(x=xmax-2, y=(0.5*pos+poss[:i].sum()),s=optims[i], ha='right', va='center', **fontdict)

设置坐标轴显示及位置

原图中,x,y轴并不是交于原点的,此处通过ax.spines[‘left’].set_position接口对其位置进行设置。

########################前序代码省略###############################ax.spines['top'].set_visible(False)
ax.spines['right'].set_visible(False)
ax.spines['left'].set_position(('axes',-0.014))   # axis offset the ax
ax.spines['bottom'].set_position(('axes',-0.02))

设置轴标题

########################前序代码省略###############################label_fontdict={'family':'Times New Roman','size':22}
ax.set_xlabel('Budget for hyperparameter optimization (# models trained)',**label_fontdict)
ax.set_ylabel('Probability of being the best',**label_fontdict)

设置刻度

########################前序代码省略###############################ax.tick_params(pad=10)
ax.set_xticks(np.arange(10,70,10))
for label in ax.xaxis.get_ticklabels()+ax.yaxis.get_ticklabels():label.set_fontfamily('Times New Roman')label.set_fontsize(18)
for line in ax.xaxis.get_ticklines() +ax.yaxis.get_ticklines() :line.set_markersize(8)

案例二

目标图

观察原图后,考虑按以下方案进行该图绘制,将图分为上中下、左中右(分三列的目的是使y坐标轴标签在图内,否则会偏离至图外)六个部分栅格,整体分为上中下三个主要绘图区域,从而完成绘图。

绘制栅格

fig = plt.figure(figsize=(5, 7), frameon=True)
nrows, ncols = 3, 3
gs = GridSpec(nrows=nrows, ncols=ncols, hspace=0.3, width_ratios=[1.5, 15, 0.5], height_ratios=[1.5, 7, 1])for row in range(nrows):for col in range(ncols):ax = fig.add_subplot(gs[row, col])ax.set_xticks([])ax.set_yticks([])ax.text(0.5, 0.5, 'ax%d,%d' % (row, col), va='center',ha='center', transform=ax.transAxes)

绘制标题行

fig = plt.figure(figsize=(5, 7), facecolor='#D7D7D7', frameon=True)
gs = GridSpec(nrows=3, ncols=3, hspace=0.3, width_ratios=[1.5, 15, 0.5], height_ratios=[1.5, 7, 1])
# ax0
ax0 = fig.add_subplot(gs[0, :], facecolor='black')
ax0.set_xticks([])
ax0.set_yticks([])
ax0.text(0, 0.9, 'WHY FACTORIES WILL\nSTAY BUSY', c='white', transform=ax0.transAxes,va='top', ha='left',fontdict={'size': 19})

绘制主体图

########################前序代码省略################################ ax1
ax1 = fig.add_subplot(gs[1:-1, 1:-1], facecolor='#D7D7D7')
x1 = np.linspace(0, 6, 7)
y11 = [3, -5, 2, 1.5, 2.6, 1.5, 1.8]
y12 = [2, 10, -7, -6, 3.5,  3,  15]
ax1.plot(x1, y11, c='#255D8E', lw=6,label='MANUFACTURING OUT PUT\n(APR.MAY AVG)')
ax1.plot(x1, y12, c='#D30D15', lw=6, label='UNFILLED ORDERS\n(APR.)')
ax1.set_xlim((0, 6))
ax1.set_ylim((-10, 20))

主体图坐标轴刻度

########################前序代码省略###############################plt.xticks(ticks=x1, labels=['%02d' % i for i in x1])
plt.yticks(ticks=np.linspace(-10, 20, 7))
ax1.xaxis.set_minor_locator(AutoMinorLocator(n=4))

主体图网格线、标题、图例

########################前序代码省略################################ set grid
ax1.grid(b=True, which='both')# set title
ax1.set_title('PERCENT CHANGE FROM A YEAR AGO', loc='left', fontsize=13.5)# set legend
ax1.legend(handlelength=1, handleheight=1, frameon=False, fontsize=13, loc=2)

主体图背景填充

########################前序代码省略###############################ax1.axhspan(ymin=-5, ymax=0, color='#E7E7E6')
ax1.axhspan(ymin=5, ymax=10, color='#E7E7E6')
ax1.axhspan(ymin=15, ymax=20, color='#E7E7E6')

绘制图注行

########################前序代码省略################################ ax2
ax2 = fig.add_subplot(gs[-1, 1:-1], frameon=False,)
ax2.set_xticks([])
ax2.set_yticks([])
ax2.set_xlim(0, 1)
ax2.text(-0.09, 0.9, 'Data:Federal Research. U.S.Centry Business\nGlobal investigate inc.', transform=ax2.transAxes,va='top', ha='left',fontdict={'size': 11.5})
plt.subplots_adjust(left=0, right=1, bottom=0.02,top=0.98, wspace=0, hspace=0)
plt.tight_layout(pad=0)

案例三

目标图

绘制栅格

fig = plt.figure(figsize=(4, 6), facecolor='#FFFBFF', frameon=True)
nrows, ncols = 3, 3
gs = GridSpec(nrows=3, ncols=3, left=0, right=1, bottom=0, top=1,hspace=0.1, height_ratios=[1.4, 10, 2], width_ratios=[1, 15, 1])for row in range(nrows):for col in range(ncols):ax = fig.add_subplot(gs[row, col])ax.set_xticks([])ax.set_yticks([])ax.text(0.5, 0.5, '%d,%d' % (row, col), va='center', fontsize=8,ha='center', transform=ax.transAxes)

绘制标题行

fig = plt.figure(figsize=(4, 6), facecolor='#FFFBFF', frameon=True)
gs = GridSpec(nrows=3, ncols=3, left=0, right=1, bottom=0, top=1,hspace=0.1, height_ratios=[1.4, 10, 2], width_ratios=[1, 15, 1])# ## ax0
ax0 = fig.add_subplot(gs[0, :], frameon=False)
ax0.set_xticks([])
ax0.set_yticks([])
ax0.text(0, 0.9, 'Red hot', c='black', transform=ax0.transAxes,va='top', ha='left',fontdict={'size': 19})
ax0.text(0, 0.4, 'Venetian\'s', c='black', transform=ax0.transAxes,va='top', ha='left',fontdict={'size': 15})

绘制主体图

########################前序代码省略###############################ax = fig.add_subplot(gs[1:-1, 1:-1], frameon=False)
ax.spines['left'].set_visible(False)
ax.spines['top'].set_visible(False)
ax.spines['right'].set_visible(False)
x = range(10)
barline = [0.2, -5, 5, 3, -10, -12, 20, 10, 10, 8]
ax.plot(x, barline, c='#719CB5', lw=4)
ax.set_ylim((-20, 30))
ax.grid(axis='y', lw=4, color='grey')
ax.axhline(y=0, xmin=0, xmax=0.5, lw=4, color='#EFA38D')

调整坐标轴刻度标签

原图中y轴刻度标签的- * 两个标识,通过次坐标进行位置和标签的设置

########################前序代码省略###############################ax.set_yticks([-20, -10, 0, 10, 20])
ax.set_yticks(ticks=[-5, 5], minor=True)
ax.yaxis.set_ticklabels(['-', '*'], minor=True, fontsize=20)
ax.tick_params(axis='y', width=0)
plt.xticks(ticks=x, labels=['1998', '', '2000',

双y坐标

在之前的绘图对象中,为涉及到双y坐标,但这个相对简单,只需要通过ax.twinx()接口生成一个次坐标子图twax即可对该子图进行绘图对象和子图对象的绘制和设置。用法与ax大致相同。

########################前序代码省略###############################tw_bar = [22, 20, 22, 25, 19, 18, 22, 27, 40, 52]
tw_line = [22, 21, 28, 26, 29, 50, 70, 75, 60, 100]
twax = ax.twinx()
twax.bar(x=x, height=tw_bar, color='#EFA38D')
twax.plot(x, tw_line, c='#762315', lw=4)
twax.set_ylim((0, 125))
twax.grid(b=False)

图例和坐标轴设置

########################前序代码省略###############################ax_legend_h = ax.get_legend_handles_labels()[0]
ax.legend(ax_legend_h, labels=['GDP\n with asian'], loc=2, frameon=False)
twax_legend_h = twax.get_legend_handles_labels()[0]
twax.legend(twax_legend_h, labels=['price', 'incoms'], loc=1, markerfirst=False, frameon=False)twax.spines['left'].set_visible(False)
twax.spines['right'].set_visible(False)
twax.spines['top'].set_visible(False)
twax.set_yticks([0, 25, 50, 75, 100])
twax.tick_params(axis='y', width=0)

绘制图注行

########################前序代码省略###############################ax3 = fig.add_subplot(gs[-1, :], frameon=False)
ax3.set_xticks([])
ax3.set_yticks([])
ax3.text(0.3, 0.9, '*West Texcas Internations #ffdfd', transform=ax3.transAxes,va='top', ha='left',fontdict={'size': 11.5})ax3.text(0, 0.5, 'Data:Federal Research. U.S.Centry Business\nGlobal investigate inc.', transform=ax3.transAxes,va='top', ha='left',fontdict={'size': 11.5})

案例四

目标图

本案例的难度在于背景的渐变色填充,在填充图部分并没有介绍过渐变色填充的方法,实际上,填充图也没有渐变色填充的接口,渐变色是通过技巧设定而成。

构造数据集

np.random.seed(3)
x = np.linspace(0, 7, 100)
y = [20]
for i in range(99):y.append(y[-1]+np.random.uniform(-0.5, 0.5))
y = np.array(y)plt.plot(x, y, lw=4, c='black')

绘制背景图

背景图是产生图像渐变效果的主要原因,通过**plt.imshow(ax.imshow)**接口实现。

np.random.seed(3)
x = np.linspace(0, 7, 100)
y = [20]
for i in range(99):y.append(y[-1]+np.random.uniform(-0.5, 0.5))
y = np.array(y)fig = plt.figure(figsize=(8, 6))
ax = fig.add_subplot(111, frameon=True)
# 绘制趋势线
ax.plot(x, y, lw=4, c='black')
xlim = xmin, xmax = x.min(), x.max()
ylim = ymin, ymax = y.min(), y.max()
# 将整张图用渐变色背景进行填充
ax.imshow(X=[[100, 100], [0, 0]],cmap=plt.cm.Blues,norm=None,extent=(xmin, xmax, ymin, ymax),aspect='auto',interpolation='bicubic',vmin=1,vmax=120,)

将上部用纯色填充

########################前序代码省略###############################ax.fill_between( x=x,y1=y,y2=ymax,color='#FFFBFF')

调整x坐标轴

########################前序代码省略###############################ax.set_xticks(np.linspace(0, 7, 8))
blank = " "*6
ax.xaxis.set_ticklabels(ticklabels=['',blank+'Sep',blank+'Oct',blank+'',blank+'Dec',blank+'Jan','', ''],)
ax.tick_params(axis='x', pad=-20  # 通过pad将数值调整到坐标轴上方, labelsize=20, direction='in', right=True, left=False, labelright=True, labelleft=False)

调整y坐标轴

########################前序代码省略###############################ax.set_yticks([16.5, 18.5, 19.4])
ax.tick_params(axis='y', pad=-50, labelsize=20, width=3, direction='in',length=50, right=True, left=False, labelright=True, labelleft=False)
ax.yaxis.set_ticklabels(ticklabels=["%.1f\n" % 16.5,"%.1f\n" % 18.5,"%.1f\n" % 19.4,],)

网格线、标题

########################前序代码省略###############################ax.grid(lw=2, color='gray', alpha=0.3)ax.set_xlim((0, 8))ax.set_title('GDP CHANGE VALUE PER MONTH\nunit:% per month',loc='left', fontdict={'size': 22})plt.subplots_adjust(left=0.02, right=0.98, bottom=0.05,top=0.85, wspace=0, hspace=0)

总结

从上述案例可以看出,绘制一张高颜值的图表需要修饰和调整的内容是很多的,是对绘图对象及图对象的综合应用。
案例一绘图过程

案例二绘图过程

案例三绘图过程

案例四绘图过程
至此,第一阶段的案例部分基本结束。

希望对你有所帮助和启发!

python可视化(案例)高颜值图的复现(学术论文、商业周刊)相关推荐

  1. python 知乎美女_知乎大神用Python爬取高颜值美女(爬虫+人脸检测+颜值检测)

    原标题:知乎大神用Python爬取高颜值美女(爬虫+人脸检测+颜值检测) 1 数据源 知乎话题『美女』下所有问题中回答所出现的图片 2 抓取工具 Python 3,并使用第三方库 Requests.l ...

  2. Python可视化案例:Mutual Funds和ETFs对比

    Python可视化案例:Mutual Funds和ETFs对比 量化分析两种基金的收益能力和综合性价比. Mutual Funds:共同基金,又称证券投资基金,是将众多投资者的余额集中一起,等于众多投 ...

  3. Python GUI案例之看图猜成语开发(第三篇)

    Python GUI案例之看图猜成语(第三篇) 前言 看图猜成语小程序开发(第三篇) 游戏闯关模式页面 Python GUI案例之看图猜成语开发(第一篇) Python GUI案例之看图猜成语开发(第 ...

  4. 【一天一个Python小案例】RGB图转简笔画

    [一天一个Python小案例]RGB图转简笔画 import scipy.ndimage import numpy as np import matplotlib.pyplot as pltdef g ...

  5. Python GUI案例之看图猜成语开发(第二篇)

    Python GUI案例之看图猜成语(第二篇) 前言 看图猜成语小程序开发(第二篇) 游戏选择模式页面 游戏训练模式页面 Python GUI案例之看图猜成语开发(第一篇) Python GUI案例之 ...

  6. Python可视化:绘制折线图、设置线条形状和marker样式

    绘制折线图.设置线条形状和marker样式 Python可视化:绘制折线图.设置线条形状和marker样式 修改线形:线形可选集合 修改marker:marker可选集合 Python可视化:绘制折线 ...

  7. 厉害了,Python画出高颜值交互股票K线图

    大家应该或多或少地会接触过股票,或者去购买股票型基金,但是提到股票基金就不得不提到的是K线图,今天小编就带领大家一起用Python来制作可以交互的高颜值K线图, 01 获取股票历史数据 我们挑选&qu ...

  8. 一天一图学Python可视化(1):线性回归图

    现代人的时间越来越碎片化,因此我们准备抛弃那种长篇大论的教程,希望大家每天花上几分钟就可以学到一个小窍门或者某种图的绘制方法.只要每天都认真看一遍文章,有时间的时候花几分钟练习一下,一段时间之后,相信 ...

  9. Python可视化 | Matplotlib绘制圆环图的两种方法!

    人生苦短,快学Python!今天给大家介绍Python可视化之环形图的绘制. 环形图,也被称为圆环图.它在功能上与饼图相同,只是中间有一个空白,并且能够同时支持多个统计数据.与标准饼图相比,环形图提供 ...

最新文章

  1. word2016公式自动编号
  2. 日报 18/06/04
  3. android 云应用开发,Android云应用开发:网络通信技术介绍
  4. 暴雪应该从《争霸艾泽拉斯》中吸取什么教训?
  5. Swift之深入解析如何使用Xcode和LLDB v2修改UI元素
  6. 【C语言简单说】十一:switch 补
  7. plotplay恢复默认设置_手把手解答win10系统potplayer经常弹出自动更新提示的还原技巧...
  8. 实战 | 我创造了新的编程语言!
  9. AI朋克致敬MNIST:只用Python和开发板,制作永不重样的时钟
  10. 实验四+116+陈洁
  11. 自己组装服务器计算机,深度学习服务器组装经验过程分享
  12. sqlalchemy 事务
  13. 2018-2019-1 20165208 《信息安全系统设计基础》第5周学习总结
  14. 用过http api 发送邮件
  15. 二十一天学通Java:调用对象为null值的引用
  16. css匹配,提高css效率
  17. python参考手册下载_python3.8.4官方中文文档 API手册 PDF 高质量版
  18. 用pkg把nodejs脚本编译成跨三平台的可执行文件的经验
  19. 株洲c语言培训机构,株洲好就业的学c语言程序设计,计算机专业地址
  20. xcode中ineligible devices的注意事项

热门文章

  1. AES256加密解密
  2. C# NUnit的安装
  3. 计算机丢失elscore dll,最近我的电脑explorer.exe总是用一段时间之后就会卡顿,然后只能重新运行它,才能恢复。但是 - Microsoft Community...
  4. 非对称秘钥,数字签名和数字证书打通的几个字箴言
  5. Linux 共享库简介(怎样创建共享库)
  6. 【MAPBOX基础功能】11、mapbox绘制symbol icon图层并进行添加、删除、更新、显隐等操作
  7. OData 协议介绍和使用
  8. # Python 数据分析三剑客 numpy / pandas / matplotlib (numpy篇②)
  9. bzoj4900【CTSC2017】Day1T1 密钥 cipher 乱搞
  10. MATLAB灰色关联度分析