数据可视化之树形图(原理+Python代码)
目录
- 一、原理介绍
- 二、代码实现
- 三、结果解释
一、原理介绍
树形图常用于对分类变量进行可视化分析,树形图的面积代表了所对应类别的数量,常用于比较各类别在数量上的差异。
二、代码实现
数据来源于上市企业数据,通过绘制树形图,来比较不同行业的企业数量分布差异。
import squarify
from pyforest import *
import warnings
warnings.filterwarnings('ignore')
import numpy as np
import pandas as pd
#读入数据
data=pd.read_csv("F:/data1/class.csv",encoding='gbk')
data.head()
行业名称 | |
---|---|
0 | 金融业 |
1 | 房地产业 |
2 | 制造业 |
3 | 水利、环境和公共设施管理业 |
4 | 房地产业 |
#图片显示中文
plt.rcParams['font.sans-serif']=['SimHei']
plt.rcParams['axes.unicode_minus'] =False #减号unicode编码
df = data.groupby('行业名称').size().reset_index(name='counts')
labels = df.apply(lambda x: str(x[0]) + "\n (" + str(x[1]) + ")", axis=1)
sizes = df['counts'].values.tolist()
colors = [plt.cm.Spectral(i/float(len(labels))) for i in range(len(labels))]
# 画图
plt.figure(figsize=(12,8), dpi= 80)
squarify.plot(sizes=sizes, label=labels, color=colors, alpha=.8)plt.title('上市企业行业分布情况')
plt.axis('off')
plt.show()
三、结果解释
从图中可以看出,不同行业的上市企业数量差别明显。其中,制造业的上市企业为多数类,有26339家;教育行业的上市企业数量最少,仅有43家。
数据可视化之树形图(原理+Python代码)相关推荐
- 数据可视化之饼状图(原理+Python代码)
数据来源于Kaggle数据集,链接:https://www.kaggle.com/Cornell-University/arxiv 目录 00.前言 一.原理介绍 二.代码实现 三.结果解释 00.前 ...
- Python中最常用的 14 种数据可视化类型的概念与代码
写在前面 收集数据后,需要对其进行解释和分析,以深入了解数据所蕴含的深意.而这个含义可以是关于模式.趋势或变量之间的关系. 数据解释是通过明确定义的方法审查数据的过程,数据解释有助于为数据赋予意义并得 ...
- 【2】数据可视化:基于 Echarts + Python 实现的动态实时大屏 - 物流大数据
目录 精彩案例汇总 效果展示 一. 确定需求方案 1.确定产品上线部署的屏幕LED分辨率 2.功能模块 3.部署方式 二.整体架构设计 三.编码实现 (基于篇幅及可读性考虑,此处展示部分关键代码) 1 ...
- 【1】数据可视化:基于 Echarts + Python 实现的动态实时大屏 - 互联网企业数据
目录 精彩案例汇总 效果展示 1.首先看动态效果图 2.再看实时分片数据图 一. 确定需求方案 1.确定产品上线部署的屏幕LED分辨率 2.功能模块 3.部署方式 二.整体架构设计 三.编码实现 (基 ...
- 【25】数据可视化:基于 Echarts + Python Flask框架动态实时大屏范例 - 企业宣传
目录 效果展示 多主题样式 一. 确定需求方案 1.确定产品上线部署的屏幕分辨率 2.部署方式 二.整体架构设计 三.编码实现 (基于篇幅及可读性考虑,此处展示部分关键代码) 1.前端html代码 - ...
- 自从学了这种数据可视化,Echarts、Python、Excel从此是路人
大家好,我是BAT的一名高级产品经理,最近忙着做一件事情,分析一款新产品的各项数据指标,为了找到增长点,完成OKR,拿到年终奖,我可是煞费苦心. 一边嫌弃Excel,自学Python和R,一边请我们的 ...
- 【4】数据可视化:基于 Echarts + Python 实现的动态实时大屏 - 厦门市某医院
目录 精彩案例汇总 效果展示 1.首先看动态效果图 2.再看实时分片数据图 一. 确定需求方案 1.确定产品上线部署的屏幕LED分辨率 2.功能模块 3.部署方式 二.整体架构设计 三.编码实现 (基 ...
- 独家 | 数据科学家对可复用Python代码的实用管理方法(附链接)
作者:Matthew Mayo, KDnuggets翻译:殷之涵校对:欧阳锦本文约3000字,建议阅读5分钟本文为大家介绍了四种关于复用Python代码的管理方法,以提高代码的效率及可读性等. 标签: ...
- python matplotlib数据可视化教程_matplotlib的Python数据可视化和探索——入门指南
matplotlib--最受欢迎的Python库,用于数据可视化和探索 我喜欢在Python中使用matplotlib.这是我学会掌握的第一个可视化库,此后一直存在.matplotlib是最受欢迎的用 ...
- JAVA三维可视化组件:Matplot 3D for JAVA(V3.0) 一个纯JAVA开发的科学数据可视化组件包 类似 Python 的matplotlib(含示例代码)
目录 概述 组件下载及项目地址 效果展示和示例代码 概述 Matplot3D for JAVA(V3.0) 是一个基于JAVA SE 1.8环境开发的三维图形图表组件. 组件由纯JAVA SE 实现( ...
最新文章
- LeetCode简单题之键盘行
- Redis第三集:redis-benchmark性能测试
- OpenResty 通过二级域名做跳转
- 面试官:为什么HTTPS是安全的
- java合并单元格同时导出excel
- As3.0与java数据类型的比较总结
- 视频数据复用光端机故障排除方法
- mysql awr 上海用户组_mysql awr v1.0.3修正说明以及发布
- 又不能起床python好学吗
- 「mysql优化专题」90%程序员面试都用得上的索引优化手册(5)
- redis 数据类型详解 以及 redis适用场景场合
- 如何用css进行网页布局,_技术笔记_课程笔记
- 对于os.walk()的认识--python遍历文件执行相应操作
- 态度决定一切细节决定成败_字体设计可以决定设计的成败:选择字体的过程
- js正则表达式校验值是否为一个数字(正负整数,正负小数均可校验)
- 资深美女基金经理首次分享基金知识,好评如潮!!!
- GitHub 上值得收藏的 100 个精选前端项目!
- 【PMP考试最新解读】第七版《PMBOK》应该如何备考?(含最新资料)
- Docker学习01---狂神说
- 评论:UiPath Aces机器人流程自动化
热门文章
- 深信服邮箱服务器,SANGFOR_aDesk_V5.2_云盘服务器部署指导.pdf
- 恶搞熊猫烧香 网友爆笑诗词句大集合
- 机器视觉软件哪个好?如何选择机器视觉软件?
- KBengine常见错误总结
- 学无止境·MySQL③
- ios 侧滑返回停顿_如何使用 iOS 系统自带侧滑返回功能
- vue-cli3添加eslint配置
- chatGPT的对手,Claude注册教程
- JAVA计算机毕业设计防疫宣传系统Mybatis+源码+数据库+lw文档+系统+调试部署
- Redis数据库目录