(关系型数据的可视化)
热力图体现了两个离散变量之间的组合关系
热力图,有时也称之为交叉填充表。该图形最典型的用法就是实现列联表的可视化,即通过图形的方式展现两个离散变量之间的组合关系。读者可以借助于seaborn模块中的heatmap函数,完成热力图的绘制。按照惯例,首先对该函数的用法及参数含义做如下解释:

heatmap(data, vmin=None, vmax=None, cmap=None, center=None, annot=None, fmt='.2g',annot_kws=None, linewidths=0, linecolor='white', cbar=True, cbar_kws = None,square=False, xticklabels='auto', yticklabels='auto', mask=None, ax=None)
  • data:指定绘制热力图的数据集。
  • vmin,vmax:用于指定图例中最小值与最大值的显示值。
  • cmap:指定一个colormap对象,用于热力图的填充色。(supported values are ‘Accent’, ‘Accent_r’, ‘Blues’, ‘Blues_r’, ‘BrBG’, ‘BrBG_r’, ‘BuGn’, ‘BuGn_r’, ‘BuPu’, ‘BuPu_r’, ‘CMRmap’, ‘CMRmap_r’, ‘Dark2’, ‘Dark2_r’, ‘GnBu’, ‘GnBu_r’, ‘Greens’, ‘Greens_r’, ‘Greys’, ‘Greys_r’, ‘OrRd’, ‘OrRd_r’, ‘Oranges’, ‘Oranges_r’, ‘PRGn’, ‘PRGn_r’, ‘Paired’, ‘Paired_r’, ‘Pastel1’, ‘Pastel1_r’, ‘Pastel2’, ‘Pastel2_r’, ‘PiYG’, ‘PiYG_r’, ‘PuBu’, ‘PuBuGn’, ‘PuBuGn_r’, ‘PuBu_r’, ‘PuOr’, ‘PuOr_r’, ‘PuRd’, ‘PuRd_r’, ‘Purples’, ‘Purples_r’, ‘RdBu’, ‘RdBu_r’, ‘RdGy’, ‘RdGy_r’, ‘RdPu’, ‘RdPu_r’, ‘RdYlBu’, ‘RdYlBu_r’, ‘RdYlGn’, ‘RdYlGn_r’, ‘Reds’, ‘Reds_r’, ‘Set1’, ‘Set1_r’, ‘Set2’, ‘Set2_r’, ‘Set3’, ‘Set3_r’, ‘Spectral’, ‘Spectral_r’, ‘Wistia’, ‘Wistia_r’, ‘YlGn’, ‘YlGnBu’, ‘YlGnBu_r’, ‘YlGn_r’, ‘YlOrBr’, ‘YlOrBr_r’, ‘YlOrRd’, ‘YlOrRd_r’, ‘afmhot’, ‘afmhot_r’, ‘autumn’, ‘autumn_r’, ‘binary’, ‘binary_r’, ‘bone’, ‘bone_r’, ‘brg’, ‘brg_r’, ‘bwr’, ‘bwr_r’, ‘cividis’, ‘cividis_r’, ‘cool’, ‘cool_r’, ‘coolwarm’, ‘coolwarm_r’, ‘copper’, ‘copper_r’, ‘cubehelix’, ‘cubehelix_r’, ‘flag’, ‘flag_r’, ‘gist_earth’, ‘gist_earth_r’, ‘gist_gray’, ‘gist_gray_r’, ‘gist_heat’, ‘gist_heat_r’, ‘gist_ncar’, ‘gist_ncar_r’, ‘gist_rainbow’, ‘gist_rainbow_r’, ‘gist_stern’, ‘gist_stern_r’, ‘gist_yarg’, ‘gist_yarg_r’, ‘gnuplot’, ‘gnuplot2’, ‘gnuplot2_r’, ‘gnuplot_r’, ‘gray’, ‘gray_r’, ‘hot’, ‘hot_r’, ‘hsv’, ‘hsv_r’, ‘icefire’, ‘icefire_r’, ‘inferno’, ‘inferno_r’, ‘jet’, ‘jet_r’, ‘magma’, ‘magma_r’, ‘mako’, ‘mako_r’, ‘nipy_spectral’, ‘nipy_spectral_r’, ‘ocean’, ‘ocean_r’, ‘pink’, ‘pink_r’, ‘plasma’, ‘plasma_r’, ‘prism’, ‘prism_r’, ‘rainbow’, ‘rainbow_r’, ‘rocket’, ‘rocket_r’, ‘seismic’, ‘seismic_r’, ‘spring’, ‘spring_r’, ‘summer’, ‘summer_r’, ‘tab10’, ‘tab10_r’, ‘tab20’, ‘tab20_r’, ‘tab20b’, ‘tab20b_r’, ‘tab20c’, ‘tab20c_r’, ‘terrain’, ‘terrain_r’, ‘turbo’, ‘turbo_r’, ‘twilight’, ‘twilight_r’, ‘twilight_shifted’, ‘twilight_shifted_r’, ‘viridis’, ‘viridis_r’, ‘vlag’, ‘vlag_r’, ‘winter’, ‘winter_r’)
  • center:指定颜色中心值,通过该参数可以调整热力图的颜色深浅。
  • annot:指定一个bool类型的值或与data参数形状一样的数组,如果为True,就在热力图的每个单元上显示数值。
  • fmt:指定单元格中数据的显示格式。
  • annot_kws:有关单元格中数值标签的其他属性描述,如颜色、大小等。
  • linewidths:指定每个单元格的边框宽度。
  • linecolor:指定每个单元格的边框颜色。
  • cbar:bool类型参数,是否用颜色条作为图例,默认为True。
  • square:bool类型参数,是否使热力图的每个单元格为正方形,默认为False。
  • cbar_kws:有关颜色条的其他属性描述。
  • xticklabels,yticklabels:指定热力图x轴和y轴的刻度标签,如果为True,则分别以数据框的变量名和行名称作为刻度标签。
  • mask:用于突出显示某些数据。
  • ax:用于指定子图的位置。

接下来,以某服装店的交易数据为例,统计2009—2012年每个月的销售总额:

然后运用如上介绍的heatmap函数对统计结果进行可视化展现,具体代码如下:

import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import numpy as np#设置绘图风格
plt.style.use('ggplot')
#处理中文乱码
plt.rcParams['font.sans-serif'] = ['Microsoft YaHei']
#坐标轴负号的处理
plt.rcParams['axes.unicode_minus']=False
# 读取数据
Sales = pd.read_excel(r'服装店的交易数据.xlsx')
# 根据交易日期,衍生出年份和月份字段
Sales['year'] = Sales.Date.dt.year
Sales['month'] = Sales.Date.dt.month
# 统计每年各月份的销售总额
Summary = Sales.pivot_table(index = 'month', columns = 'year', values = 'Sales', aggfunc = np.sum)
#打印销售额的列联表格式
print(Summary.head(13))
# 绘制热力图
sns.heatmap(data = Summary, # 指定绘图数据cmap = 'PuBuGn', # 指定填充色linewidths = .1, # 设置每个单元格边框的宽度annot = True, # 显示数值fmt = '.1e' # 以科学计算法显示数据)
#添加标题
plt.title('每年各月份销售总额热力图')
# 显示图形
plt.show()

结果:

year          2009         2010         2011         2012
month
1      520452.5595  334535.0605  255919.2030  341339.2470
2      333909.5565  271881.9480  299890.1410  281270.1790
3      411628.7290  217808.0065  296151.7510  387093.7650
4      406848.7620  266968.5890  290384.4670  278402.9940
5      228025.5680  287796.5150  264673.6260  384588.0615
6      273758.8780  293600.7750  196918.1455  316775.7855
7      412797.4600  240297.1585  287905.1865  275160.0495
8      329754.7150  205789.6440  275211.3295  306671.2835
9      325292.3145  419689.7785  278230.1660  319675.1765
10     347173.8005  368544.9250  305660.4510  351438.0925
11     253867.1960  295010.9555  385452.7300  261206.4290
12     420420.2355  368093.9540  328898.4945  351756.4180

它是列联表的格式,反映的是每年各月份的销售总额。很显然,通过肉眼是无法迅速发现销售业绩在各月份中的差异的,如果将数据表以热力图的形式展现,问题就会简单很多。

如上图呀所示就是将表格进行可视化的结果,每个单元格颜色的深浅代表数值的高低,通过颜色就能迅速发现每年各月份销售情况的好坏。

Python数据可视化的例子——热力图(heatmap)相关推荐

  1. Python数据可视化的例子——画图总结

    前面写了大量的文章是关于数据的可视化,通过每一个具体的案例介绍了有关matplotlib模块.pandas模块和seaborn模块的绘图函数和参数含义,分别针对离散型数据.数值型数据和关系型数据讲解了 ...

  2. Python数据可视化的例子——气泡图(bubble)

    (关系型数据的可视化) 气泡图是散点图中的一种类型,可以展现三个数值变量之间的关系 之前的文章有介绍过一般的散点图都是反映两个数值型变量的关系,所以如果还想通过散点图添加第三个数值型变量的信息,一般可 ...

  3. Python数据可视化的例子——箱线图(box)

    箱线图是另一种体现数据分布的图形,通过该图可以得知数据的下须值(Q1-1.5IQR).下四分位数(Q1).中位数(Q2).均值.上四分位数(Q3)和上须值(Q3+1.5IQR),更重要的是,箱线图还可 ...

  4. Python数据可视化的例子——多个图形的合并

    工作中往往会根据业务需求,将绘制的多个图形组合到一个大图框内,形成类似仪表板的效果.针对这种情况,如何应用Python将前面所学的各种图形汇总到一个图表中,这将是本节所要学习的重点. 关于多种图形的组 ...

  5. Python数据可视化的例子——散点图(scatter)

    (关系型数据的可视化) 散点图用于发现两个数值变量之间的关系 如果需要研究两个数值型变量之间是否存在某种关系,例如正向的线性关系,或者是趋势性的非线性关系,那么散点图将是最佳的选择. 1.matplo ...

  6. Python数据可视化的例子——直方图(hist)和核密度曲线(kde)

    直方图一般用来观察数据的分布形态,横坐标代表数值的均匀分段,纵坐标代表每个段内的观测数量(频数).一般直方图都会与核密度图搭配使用,目的是更加清晰地掌握数据的分布特征,下面将详细介绍该类型图形的绘制. ...

  7. Python数据可视化的例子——条形图(bar)

    1.matplotlib模块 应用matplotlib模块绘制条形图,需要调用bar函数,关于该函数的语法和参数含义如下: bar(x, height, width=0.8, bottom=None, ...

  8. Python数据可视化的例子——小提琴图(violin)

    小提琴图是比较有意思的统计图形,它将数值型数据的核密度图与箱线图融合在一起,进而得到一个形似小提琴的图形.尽管matplotlib模块也提供了绘制小提琴图的函数violinplot,但是绘制出来的图形 ...

  9. python数据可视化--pyecharts生成图表

    [python可视化系列]python数据可视化利器--pyecharts echarts官网 一.前言 echarts是什么?下面是来自官方的介绍: ECharts,缩写来自Enterprise C ...

最新文章

  1. 北大读博手记:怎样完成自己的博士生涯?非常具有指导性!
  2. 睿熙科技完成Pre-A融资,用于VCSEL芯片量产
  3. 【51nod】1239 欧拉函数之和 杜教筛
  4. oracle+ddl+执行很慢,Oracle的DDL语句不能回滚(直接提交)
  5. php ldap 模块,不重新编译为PHP增加LDAP模块的支持
  6. oracle半角全椒_Oracle全角和半角处理函数
  7. 云计算示范项目_瑞松科技基于工业互联网的设备运维及工艺管理云平台成功入选2020年工业互联网试点示范项目...
  8. Android上拉查看详情实现
  9. win7 管理iphone日历_iPhone和Windows同步文件,这7个技巧让你的效率成倍增加
  10. python图像处理之一 - Pillow的基本用法
  11. 居家第二十五天朋友的豆芽菜
  12. 24段魔尺拼图指南_拼图项目动手指南
  13. Git和GitHub(尚硅谷的视频教学)
  14. python中continue用法_Python学习笔记之Break和Continue用法分析
  15. (转)造势满分的摩羯智投都存在哪些问题?
  16. matlab中audioread函数的用法
  17. 2022年门座式起重机司机考试模拟100题及模拟考试
  18. angular单个页面加载多个ng-app
  19. 东华大学2020考研计算机复试准备上机题解析答案_进阶篇(31-60)
  20. 【开启SSH】小米AIoT路由器 AC2350 (R2350)

热门文章

  1. 我辞退了一位简历造假的程序员
  2. 基于SSM框架的图书销售系统
  3. 如何获取Flickr图片链接地址作为外链图片
  4. 广州app定制:IO定制游APP
  5. Impala之02-原理、架构分析(1)
  6. java.nio.charset.MalformedInputException: Input length = 2
  7. 回顾2022,展望2023,一个普通98年程序员的自述和分享
  8. Ubuntu 16.04 硬盘安装
  9. 漫谈CRM体系化建设5:CRM体系化解决方案
  10. 加米谷学院大数据培训课程安排