不要停止奔跑,不要回顾来路,来路无可眷恋,值得期待的只有前方。——《马男波杰克》 ​​​​

一、matplotlib绘制热力图

Matplotlib是Python著名的2D绘图库,该库仿造Matlab提供了一整套相似的绘图函数,用于绘图和绘表,是强大的数据可视化工具和做图库,且绘制出的图形美观。

代码如下:

import pandas as pd

import matplotlib.pyplot as plt

import numpy as np

import matplotlib as mpl

df = pd.read_excel('real_estate_info.xlsx')

area = df['土地位置']

# 成都主要 区 县 市 9区6县4市

with open('test.txt', encoding='utf-8') as f:

areas = f.read().split('、')

for item in areas:

# 每个行政区 对每行数据都进行判断

# 土地位置里包含行政区名 值为规划建筑面积 不包含 值为0

# 得到19列 以行政区为列名 其下面值为规划建筑面积

df[item] = [eval(df.loc[x, '规划建筑面积'][:-1]) if item in df.loc[x, '土地位置'] else 0 for x in range(len(df['土地位置']))]

date = df['推出时间'].str.split('年', expand=True)[0] # 这列的字符串 按年切割

df['年份'] = date # 添加新的一列 年份

df1 = df[areas]

df1.index = df['年份']

df2 = df1.groupby('年份').sum()

# print(df2.iloc[:5, ::]) # 2020年数据只有到2月的 舍去

# print(type(df2.iloc[:5, ::].T)) # 转置

datas = np.array(df2.iloc[:5, ::].T) # 19行 5列 二维数组

print(datas)

x_label = [year for year in range(2015, 2020)]

y_label = areas

mpl.rcParams['font.family'] = 'Kaiti' # 中文显示

fig, ax = plt.subplots(figsize=(15, 9)) # 绘图

heatmap = plt.pcolor(datas)

for y in range(datas.shape[0]):

for x in range(datas.shape[1]):

plt.text(x + 0.5, y + 0.5, '%.1f' % datas[y, x], # 热力图种每个格子添加文本 数据项设置

horizontalalignment='center', verticalalignment='center',

)

# x y轴刻度设置

plt.xticks(np.arange(0.5, 5.5, 1))

plt.yticks(np.arange(0.5, 19.5, 1))

# x y轴标签设置

ax.set_xticklabels(x_label)

ax.set_yticklabels(areas)

# title

ax.set_title(r'各行政区2015-2019年的总规划建筑面积(平方米)', fontsize=25, x=0.5, y=1.02)

# 隐藏边框

ax.spines['top'].set_visible(False)

ax.spines['right'].set_visible(False)

ax.spines['left'].set_visible(False)

ax.spines['bottom'].set_visible(False)

plt.savefig('heat_map.png')

# 热力图 展示

plt.colorbar(heatmap)

plt.show()

运行效果如下:

matplotlib绘制heatmap,该方法比较繁琐,要调用很多辅助函数才能实现效果更好的热图。

二、seaborn绘制热力图

Seaborn是基于matplotlib的Python可视化库。它提供了一个高级界面来绘制有吸引力的统计图形。Seaborn其实是在matplotlib的基础上进行了更高级的API封装,从而使得作图更加容易,不需要经过大量的调整就能使你的图变得精致。

seaborn.heatmap(data, vmin=None, vmax=None, cmap=None, center=None, robust=False,

annot=None, fmt=".2g", annot_kws=None,

linewidths=0, linecolor="white",

cbar=True, cbar_kws=None, cbar_ax=None,

square=False, xticklabels="auto", yticklabels="auto",

mask=None, ax=None, **kwargs):

data:矩阵数据集,可以是numpy的数组(ndarray),也可以是pandas的DataFrame。如果是DataFrame,则df的index/column信息会对应到heatmap上,即df.index对应到热力图的x轴,df.columns对应到热力图的y轴

vmax,vmin:分别是热力图的颜色取值最大和最小范围,默认是根据data数据表里的取值确定

center:数据表取值有差异时,设置热力图的色彩中心对齐值;通过设置center值,可以调整生成的图像颜色的整体深浅

robust:默认取值False;如果是True,且没设定vmin和vmax的值,热力图的颜色映射范围根据具有鲁棒性的分位数设定,而不是用极值设定

annot(annotate的缩写):默认取值False;如果为True,在热力图每个方格写入对应的数据

fmt:字符串格式代码,矩阵上标识数字的数据格式,比如保留小数点后几位数字

annot_kws:默认取值False;如果是True,设置热力图矩阵上数字的大小颜色字体

linewidths:定义热力图里表示两两特征关系的矩阵小块之间的间隔大小

linecolor:切分热力图上每个矩阵小块的线的颜色,默认值是 white

xticklabels,,yticklabels:xticklabels控制x轴标签的输出;yticklabels控制y轴标签的输出。默认值是auto,如果是True,则以DataFrame的index作为x轴标签、columns作为y轴的标签。如果是False,则不添加行标签名。如果是列表,则标签名改为列表中给的内容。如果是整数K,则在图上每隔K个标签进行一次标注。 如果是auto,则自动选择标签的标注间距,将标签名不重叠的部分(或全部)输出

mask:控制某个矩阵块是否显示出来。默认值是None。如果是布尔型的DataFrame,则将DataFrame里True的位置用白色覆盖掉

ax:设置作图的坐标轴,一般画多个子图时需要修改不同子图的该值

**kwargs:All other keyword arguments are passed to ax.pcolormesh

cbar:是否在热力图侧边绘制颜色刻度条,默认值是True

cbar_kws:热力图侧边绘制颜色刻度条时,相关字体设置,默认值是None

cbar_ax:热力图侧边绘制颜色刻度条时,刻度条位置设置,默认值是None

cmap:从数字到色彩空间的映射

cmap:从数字到色彩空间的映射,改变cmap参数可以改变图的颜色,cmap有以下选择:

Accent, Accent_r, Blues, Blues_r, BrBG, BrBG_r, BuGn, BuGn_r, BuPu, BuPu_r, CMRmap, CMRmap_r, Dark2, Dark2_r, GnBu, GnBu_r, Greens,Greens_r, Greys, Greys_r, OrRd, OrRd_r, Oranges, Oranges_r, PRGn, PRGn_r, Paired, Paired_r, Pastel1, Pastel1_r, Pastel2, Pastel2_r,

PiYG, PiYG_r, PuBu, PuBuGn, PuBuGn_r, PuBu_r, PuOr, PuOr_r, PuRd, PuRd_r, Purples, Purples_r, RdBu, RdBu_r, RdGy, RdGy_r, RdPu, RdPu_r, RdYlBu, RdYlBu_r, RdYlGn, RdYlGn_r, Reds, Reds_r, Set1, Set1_r, Set2, Set2_r, Set3, Set3_r, Spectral, Spectral_r, Wistia, Wistia_r, YlGn, YlGnBu, YlGnBu_r, YlGn_r, YlOrBr, YlOrBr_r, YlOrRd, YlOrRd_r, afmhot, afmhot_r, autumn, autumn_r, binary, binary_r, bone, bone_r, brg, brg_r, bwr, bwr_r, cividis, cividis_r, cool, cool_r, coolwarm, coolwarm_r, copper, copper_r, cubehelix, cubehelix_r, flag, flag_r, gist_earth, gist_earth_r, gist_gray, gist_gray_r, gist_heat, gist_heat_r, gist_ncar, gist_ncar_r, gist_rainbow, gist_rainbow_r, gist_stern, gist_stern_r, gist_yarg, gist_yarg_r, gnuplot, gnuplot2, gnuplot2_r, gnuplot_r, gray, gray_r, hot, hot_r, hsv, hsv_r, icefire, icefire_r, inferno, inferno_r, jet, jet_r, magma, magma_r, mako, mako_r, nipy_spectral, nipy_spectral_r, ocean, ocean_r, pink, pink_r, plasma, plasma_r, prism, prism_r, rainbow, rainbow_r, rocket, rocket_r, seismic, seismic_r, spring, spring_r, summer, summer_r, tab10, tab10_r, tab20, tab20_r, tab20b, tab20b_r, tab20c, tab20c_r, terrain, terrain_r, twilight, twilight_r, twilight_shifted, twilight_shifted_r, viridis, viridis_r, vlag, vlag_r, winter, winter_r

代码如下:

import matplotlib.pyplot as plt

import numpy as np

import seaborn as sns

import pandas as pd

import matplotlib as mpl

df = pd.read_excel('real_estate_info.xlsx')

area = df['土地位置']

# 成都主要 区 县 市 9区6县4市

with open('test.txt', encoding='utf-8') as f:

areas = f.read().split('、')

for item in areas:

# 每个行政区 对每行数据都进行判断

# 土地位置里包含行政区名 值为规划建筑面积 不包含 值为0

# 得到19列 以行政区为列名 其下面为规划建筑面积

df[item] = [eval(df.loc[x, '规划建筑面积'][:-1]) if item in df.loc[x, '土地位置'] else 0 for x in range(len(df['土地位置']))]

date = df['推出时间'].str.split('年', expand=True)[0] # 这列的字符串 按年切割

df['年份'] = date # 添加新的一列 年份

df1 = df[areas]

df1.index = df['年份']

df2 = df1.groupby('年份').sum()

# print(df2.iloc[:5, ::]) # 2020年数据只有到2月的 舍去

# print(type(df2.iloc[:5, ::].T)) # 转置

datas = np.array(df2.iloc[:5, ::].T) # 19行 5列 二维数组

print(datas, type(datas))

x_label = [year for year in range(2015, 2020)]

y_label = areas

mpl.rcParams['font.family'] = 'Kaiti'

fig, ax = plt.subplots(figsize=(15, 9))

# 绘制热力图 cmap:从数字到色彩空间的映射

sns.heatmap(data=df2.iloc[:5, ::].T, linewidths=0.25,

linecolor='black', ax=ax, annot=True,

fmt='.1f', cmap='OrRd', robust=True,

)

# 添加描述信息 x y轴 title

ax.set_xlabel('年份', fontdict={'size': 18, 'weight': 'bold'})

ax.set_ylabel('行政区', fontdict={'size': 18, 'weight': 'bold'})

ax.set_title(r'各行政区2015-2019年的总规划建筑面积(平方米)', fontsize=25, x=0.5, y=1.02)

# 隐藏边框

ax.spines['top'].set_visible(False)

ax.spines['right'].set_visible(False)

ax.spines['left'].set_visible(False)

ax.spines['bottom'].set_visible(False)

# 保存 展示图片

plt.savefig('heat_map.png')

plt.show()

运行效果如下:

改变cmap参数,得到不同的效果:

python生成热度图_Python数据可视化 热力图相关推荐

  1. python生成热度图_Python - 场景热力图绘制[转]

    在做诸如人群密集度等可视化的时候,可能会考虑使用热力图,在Python中能很方便地绘制热力图. 以识别图片中的行人,并绘制热力图为例. 步骤1:首先识别图像中的人,得到bounding box的中心坐 ...

  2. python pyecharts 折线图_Python数据可视化之pyecharts实现各种图表

    之前的一篇文章介绍了使用Matplotlib实现各种统计图表,Python数据可视化之Matplotlib实现各种图表.这篇文章就介绍使用pyecharts实现各种统计图表. 1.pyecharts介 ...

  3. python画误差图_Python数据可视化:如何创建误差图

    一图胜千言,使用Python的matplotlib库,可以快速创建高质量的图形. 这是Python数据可视化的系列短篇,针对初级和中级用户,将理论和示例代码相结合,使用matplotlib, seab ...

  4. python生成热度图_Python 绘制热度图(seaborn)

    原博文 2020-05-08 15:16 − 进行数据处理时,对于数据的可视化展示可以更好的表现数据的关系 论文中,漂亮的热度图会让人眼前一亮 Seaborn 中的 heatmap就可以用来创建热度图 ...

  5. python画厢式图_Python数据可视化:箱线图多种库画法

    概念 箱线图通过数据的四分位数来展示数据的分布情况.例如:数据的中心位置,数据间的离散程度,是否有异常值等. 把数据从小到大进行排列并等分成四份,第一分位数(Q1),第二分位数(Q2)和第三分位数(Q ...

  6. python做动态折线图_Python数据可视化 pyecharts实现各种统计图表过程详解

    1.pyecharts介绍 Echarts是一款由百度公司开发的开源数据可视化JS库,pyecharts是一款使用python调用echarts生成数据可视化的类库,可实现柱状图,折线图,饼状图,地图 ...

  7. python panda 库箱线图_Python数据可视化:箱线图多种库画法

    概念 箱线图通过数据的四分位数来展示数据的分布情况.例如:数据的中心位置,数据间的离散程度,是否有异常值等. 把数据从小到大进行排列并等分成四份,第一分位数(Q1),第二分位数(Q2)和第三分位数(Q ...

  8. python动态横道图_Python数据可视化:甘特图画法

    大家好,我是一名Python数据分析师,我想把自己转行成功之路上的经验分享给大家,由此就有了我的人工智能四部曲:<15天学会Python编程>.<每天10分钟,用Python学数据分 ...

  9. python前端框架实例_Python数据可视化:PyQt5 + ECharts框架实例

    引言 对于Python下桌面软件的开发已经有了很多数据可视化的库,如Matplotlib.Seaborn.Pyqtgraph.Plotly等等,但这些库更适合于后端程序员的软件开发. 实际上在前端网页 ...

最新文章

  1. php mongo二级查询时间,php查询MongoDB遇到长整型的问题
  2. Mysql Workbench导出数据库时报 Unknown table ‘column_statistics‘ in information_schema (1109)
  3. keras环境搭建 [过程记录]
  4. 第十九节:Asp.Net Core WebApi知识总结(一)
  5. 在mysql表中如何变换列和行_在SQL中转换列和行的简单方法?
  6. (数据库系统概论|王珊)第十一章并发控制-第一节:并发控制概述
  7. scrapy自定义Request的缓存策略(减少内存占用)
  8. 关于40G/100G高速PHY的测试
  9. go产生平台相关的0xFFFF
  10. NOIP2013提高组华容道题解
  11. html播放器滚动字幕,HTML 滚动字幕
  12. 高斯核函数 python实现
  13. 嗨到起飞!终于搞懂前端数据可视化了!
  14. 大数据难学吗?如何学习大数据?(附学习路线)
  15. [附源码]java毕业设计动物保护网站
  16. CDH集群安装OpenLDAP服务并集成sssd客户端
  17. sap客户信贷_通过SAP ABAP接口修改客户信贷主数据
  18. 8253的六种工作方式
  19. 修改MySQL数据库的密码
  20. Steering Behaviors

热门文章

  1. mysql-generator用法_【原创】MyBatis Generator使用小记
  2. java private 内部类_java中外部类是否可以访问内部类的private 元素呢?
  3. 微型计算机有缺点,PT开口安装微机消谐的优缺点?
  4. java面向对象程序_面向对象编程基础(java)
  5. viewpager的优化
  6. 基于JAVA+SpringMVC+MYSQL的人事管理系统
  7. lisp 多段线转面域_Objectarx 相交矩形求并集 面域转多段线
  8. [******] 树问题:普通二叉树的创建与遍历
  9. Spring boot 连接Redis实现HMSET操作
  10. Windows 下搭建 Ruby 开发环境