Python数据可视化的例子——热力图(heatmap)
(关系型数据的可视化)
热力图体现了两个离散变量之间的组合关系
热力图,有时也称之为交叉填充表。该图形最典型的用法就是实现列联表的可视化,即通过图形的方式展现两个离散变量之间的组合关系。读者可以借助于seaborn模块中的heatmap函数,完成热力图的绘制。按照惯例,首先对该函数的用法及参数含义做如下解释:
heatmap(data, vmin=None, vmax=None, cmap=None, center=None, annot=None, fmt='.2g',annot_kws=None, linewidths=0, linecolor='white', cbar=True, cbar_kws = None,square=False, xticklabels='auto', yticklabels='auto', mask=None, ax=None)
- data:指定绘制热力图的数据集。
- vmin,vmax:用于指定图例中最小值与最大值的显示值。
- cmap:指定一个colormap对象,用于热力图的填充色。(supported values are ‘Accent’, ‘Accent_r’, ‘Blues’, ‘Blues_r’, ‘BrBG’, ‘BrBG_r’, ‘BuGn’, ‘BuGn_r’, ‘BuPu’, ‘BuPu_r’, ‘CMRmap’, ‘CMRmap_r’, ‘Dark2’, ‘Dark2_r’, ‘GnBu’, ‘GnBu_r’, ‘Greens’, ‘Greens_r’, ‘Greys’, ‘Greys_r’, ‘OrRd’, ‘OrRd_r’, ‘Oranges’, ‘Oranges_r’, ‘PRGn’, ‘PRGn_r’, ‘Paired’, ‘Paired_r’, ‘Pastel1’, ‘Pastel1_r’, ‘Pastel2’, ‘Pastel2_r’, ‘PiYG’, ‘PiYG_r’, ‘PuBu’, ‘PuBuGn’, ‘PuBuGn_r’, ‘PuBu_r’, ‘PuOr’, ‘PuOr_r’, ‘PuRd’, ‘PuRd_r’, ‘Purples’, ‘Purples_r’, ‘RdBu’, ‘RdBu_r’, ‘RdGy’, ‘RdGy_r’, ‘RdPu’, ‘RdPu_r’, ‘RdYlBu’, ‘RdYlBu_r’, ‘RdYlGn’, ‘RdYlGn_r’, ‘Reds’, ‘Reds_r’, ‘Set1’, ‘Set1_r’, ‘Set2’, ‘Set2_r’, ‘Set3’, ‘Set3_r’, ‘Spectral’, ‘Spectral_r’, ‘Wistia’, ‘Wistia_r’, ‘YlGn’, ‘YlGnBu’, ‘YlGnBu_r’, ‘YlGn_r’, ‘YlOrBr’, ‘YlOrBr_r’, ‘YlOrRd’, ‘YlOrRd_r’, ‘afmhot’, ‘afmhot_r’, ‘autumn’, ‘autumn_r’, ‘binary’, ‘binary_r’, ‘bone’, ‘bone_r’, ‘brg’, ‘brg_r’, ‘bwr’, ‘bwr_r’, ‘cividis’, ‘cividis_r’, ‘cool’, ‘cool_r’, ‘coolwarm’, ‘coolwarm_r’, ‘copper’, ‘copper_r’, ‘cubehelix’, ‘cubehelix_r’, ‘flag’, ‘flag_r’, ‘gist_earth’, ‘gist_earth_r’, ‘gist_gray’, ‘gist_gray_r’, ‘gist_heat’, ‘gist_heat_r’, ‘gist_ncar’, ‘gist_ncar_r’, ‘gist_rainbow’, ‘gist_rainbow_r’, ‘gist_stern’, ‘gist_stern_r’, ‘gist_yarg’, ‘gist_yarg_r’, ‘gnuplot’, ‘gnuplot2’, ‘gnuplot2_r’, ‘gnuplot_r’, ‘gray’, ‘gray_r’, ‘hot’, ‘hot_r’, ‘hsv’, ‘hsv_r’, ‘icefire’, ‘icefire_r’, ‘inferno’, ‘inferno_r’, ‘jet’, ‘jet_r’, ‘magma’, ‘magma_r’, ‘mako’, ‘mako_r’, ‘nipy_spectral’, ‘nipy_spectral_r’, ‘ocean’, ‘ocean_r’, ‘pink’, ‘pink_r’, ‘plasma’, ‘plasma_r’, ‘prism’, ‘prism_r’, ‘rainbow’, ‘rainbow_r’, ‘rocket’, ‘rocket_r’, ‘seismic’, ‘seismic_r’, ‘spring’, ‘spring_r’, ‘summer’, ‘summer_r’, ‘tab10’, ‘tab10_r’, ‘tab20’, ‘tab20_r’, ‘tab20b’, ‘tab20b_r’, ‘tab20c’, ‘tab20c_r’, ‘terrain’, ‘terrain_r’, ‘turbo’, ‘turbo_r’, ‘twilight’, ‘twilight_r’, ‘twilight_shifted’, ‘twilight_shifted_r’, ‘viridis’, ‘viridis_r’, ‘vlag’, ‘vlag_r’, ‘winter’, ‘winter_r’)
- center:指定颜色中心值,通过该参数可以调整热力图的颜色深浅。
- annot:指定一个bool类型的值或与data参数形状一样的数组,如果为True,就在热力图的每个单元上显示数值。
- fmt:指定单元格中数据的显示格式。
- annot_kws:有关单元格中数值标签的其他属性描述,如颜色、大小等。
- linewidths:指定每个单元格的边框宽度。
- linecolor:指定每个单元格的边框颜色。
- cbar:bool类型参数,是否用颜色条作为图例,默认为True。
- square:bool类型参数,是否使热力图的每个单元格为正方形,默认为False。
- cbar_kws:有关颜色条的其他属性描述。
- xticklabels,yticklabels:指定热力图x轴和y轴的刻度标签,如果为True,则分别以数据框的变量名和行名称作为刻度标签。
- mask:用于突出显示某些数据。
- ax:用于指定子图的位置。
接下来,以某服装店的交易数据为例,统计2009—2012年每个月的销售总额:
然后运用如上介绍的heatmap函数对统计结果进行可视化展现,具体代码如下:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import numpy as np#设置绘图风格
plt.style.use('ggplot')
#处理中文乱码
plt.rcParams['font.sans-serif'] = ['Microsoft YaHei']
#坐标轴负号的处理
plt.rcParams['axes.unicode_minus']=False
# 读取数据
Sales = pd.read_excel(r'服装店的交易数据.xlsx')
# 根据交易日期,衍生出年份和月份字段
Sales['year'] = Sales.Date.dt.year
Sales['month'] = Sales.Date.dt.month
# 统计每年各月份的销售总额
Summary = Sales.pivot_table(index = 'month', columns = 'year', values = 'Sales', aggfunc = np.sum)
#打印销售额的列联表格式
print(Summary.head(13))
# 绘制热力图
sns.heatmap(data = Summary, # 指定绘图数据cmap = 'PuBuGn', # 指定填充色linewidths = .1, # 设置每个单元格边框的宽度annot = True, # 显示数值fmt = '.1e' # 以科学计算法显示数据)
#添加标题
plt.title('每年各月份销售总额热力图')
# 显示图形
plt.show()
结果:
year 2009 2010 2011 2012
month
1 520452.5595 334535.0605 255919.2030 341339.2470
2 333909.5565 271881.9480 299890.1410 281270.1790
3 411628.7290 217808.0065 296151.7510 387093.7650
4 406848.7620 266968.5890 290384.4670 278402.9940
5 228025.5680 287796.5150 264673.6260 384588.0615
6 273758.8780 293600.7750 196918.1455 316775.7855
7 412797.4600 240297.1585 287905.1865 275160.0495
8 329754.7150 205789.6440 275211.3295 306671.2835
9 325292.3145 419689.7785 278230.1660 319675.1765
10 347173.8005 368544.9250 305660.4510 351438.0925
11 253867.1960 295010.9555 385452.7300 261206.4290
12 420420.2355 368093.9540 328898.4945 351756.4180
它是列联表的格式,反映的是每年各月份的销售总额。很显然,通过肉眼是无法迅速发现销售业绩在各月份中的差异的,如果将数据表以热力图的形式展现,问题就会简单很多。
如上图呀所示就是将表格进行可视化的结果,每个单元格颜色的深浅代表数值的高低,通过颜色就能迅速发现每年各月份销售情况的好坏。
Python数据可视化的例子——热力图(heatmap)相关推荐
- Python数据可视化的例子——画图总结
前面写了大量的文章是关于数据的可视化,通过每一个具体的案例介绍了有关matplotlib模块.pandas模块和seaborn模块的绘图函数和参数含义,分别针对离散型数据.数值型数据和关系型数据讲解了 ...
- Python数据可视化的例子——气泡图(bubble)
(关系型数据的可视化) 气泡图是散点图中的一种类型,可以展现三个数值变量之间的关系 之前的文章有介绍过一般的散点图都是反映两个数值型变量的关系,所以如果还想通过散点图添加第三个数值型变量的信息,一般可 ...
- Python数据可视化的例子——箱线图(box)
箱线图是另一种体现数据分布的图形,通过该图可以得知数据的下须值(Q1-1.5IQR).下四分位数(Q1).中位数(Q2).均值.上四分位数(Q3)和上须值(Q3+1.5IQR),更重要的是,箱线图还可 ...
- Python数据可视化的例子——多个图形的合并
工作中往往会根据业务需求,将绘制的多个图形组合到一个大图框内,形成类似仪表板的效果.针对这种情况,如何应用Python将前面所学的各种图形汇总到一个图表中,这将是本节所要学习的重点. 关于多种图形的组 ...
- Python数据可视化的例子——散点图(scatter)
(关系型数据的可视化) 散点图用于发现两个数值变量之间的关系 如果需要研究两个数值型变量之间是否存在某种关系,例如正向的线性关系,或者是趋势性的非线性关系,那么散点图将是最佳的选择. 1.matplo ...
- Python数据可视化的例子——直方图(hist)和核密度曲线(kde)
直方图一般用来观察数据的分布形态,横坐标代表数值的均匀分段,纵坐标代表每个段内的观测数量(频数).一般直方图都会与核密度图搭配使用,目的是更加清晰地掌握数据的分布特征,下面将详细介绍该类型图形的绘制. ...
- Python数据可视化的例子——条形图(bar)
1.matplotlib模块 应用matplotlib模块绘制条形图,需要调用bar函数,关于该函数的语法和参数含义如下: bar(x, height, width=0.8, bottom=None, ...
- Python数据可视化的例子——小提琴图(violin)
小提琴图是比较有意思的统计图形,它将数值型数据的核密度图与箱线图融合在一起,进而得到一个形似小提琴的图形.尽管matplotlib模块也提供了绘制小提琴图的函数violinplot,但是绘制出来的图形 ...
- python数据可视化--pyecharts生成图表
[python可视化系列]python数据可视化利器--pyecharts echarts官网 一.前言 echarts是什么?下面是来自官方的介绍: ECharts,缩写来自Enterprise C ...
最新文章
- 北大读博手记:怎样完成自己的博士生涯?非常具有指导性!
- 睿熙科技完成Pre-A融资,用于VCSEL芯片量产
- 【51nod】1239 欧拉函数之和 杜教筛
- oracle+ddl+执行很慢,Oracle的DDL语句不能回滚(直接提交)
- php ldap 模块,不重新编译为PHP增加LDAP模块的支持
- oracle半角全椒_Oracle全角和半角处理函数
- 云计算示范项目_瑞松科技基于工业互联网的设备运维及工艺管理云平台成功入选2020年工业互联网试点示范项目...
- Android上拉查看详情实现
- win7 管理iphone日历_iPhone和Windows同步文件,这7个技巧让你的效率成倍增加
- python图像处理之一 - Pillow的基本用法
- 居家第二十五天朋友的豆芽菜
- 24段魔尺拼图指南_拼图项目动手指南
- Git和GitHub(尚硅谷的视频教学)
- python中continue用法_Python学习笔记之Break和Continue用法分析
- (转)造势满分的摩羯智投都存在哪些问题?
- matlab中audioread函数的用法
- 2022年门座式起重机司机考试模拟100题及模拟考试
- angular单个页面加载多个ng-app
- 东华大学2020考研计算机复试准备上机题解析答案_进阶篇(31-60)
- 【开启SSH】小米AIoT路由器 AC2350 (R2350)