目录

  • 一、原理介绍
  • 二、代码实现
  • 三、结果解释

一、原理介绍

树形图常用于对分类变量进行可视化分析,树形图的面积代表了所对应类别的数量,常用于比较各类别在数量上的差异。

二、代码实现

数据来源于上市企业数据,通过绘制树形图,来比较不同行业的企业数量分布差异。

import squarify
from pyforest import *
import warnings
warnings.filterwarnings('ignore')
import numpy as np
import pandas as pd
#读入数据
data=pd.read_csv("F:/data1/class.csv",encoding='gbk')
data.head()
行业名称
0 金融业
1 房地产业
2 制造业
3 水利、环境和公共设施管理业
4 房地产业
#图片显示中文
plt.rcParams['font.sans-serif']=['SimHei']
plt.rcParams['axes.unicode_minus'] =False #减号unicode编码
df = data.groupby('行业名称').size().reset_index(name='counts')
labels = df.apply(lambda x: str(x[0]) + "\n (" + str(x[1]) + ")", axis=1)
sizes = df['counts'].values.tolist()
colors = [plt.cm.Spectral(i/float(len(labels))) for i in range(len(labels))]
# 画图
plt.figure(figsize=(12,8), dpi= 80)
squarify.plot(sizes=sizes, label=labels, color=colors, alpha=.8)plt.title('上市企业行业分布情况')
plt.axis('off')
plt.show()

三、结果解释

从图中可以看出,不同行业的上市企业数量差别明显。其中,制造业的上市企业为多数类,有26339家;教育行业的上市企业数量最少,仅有43家。

数据可视化之树形图(原理+Python代码)相关推荐

  1. 数据可视化之饼状图(原理+Python代码)

    数据来源于Kaggle数据集,链接:https://www.kaggle.com/Cornell-University/arxiv 目录 00.前言 一.原理介绍 二.代码实现 三.结果解释 00.前 ...

  2. Python中最常用的 14 种数据可视化类型的概念与代码

    写在前面 收集数据后,需要对其进行解释和分析,以深入了解数据所蕴含的深意.而这个含义可以是关于模式.趋势或变量之间的关系. 数据解释是通过明确定义的方法审查数据的过程,数据解释有助于为数据赋予意义并得 ...

  3. 【2】数据可视化:基于 Echarts + Python 实现的动态实时大屏 - 物流大数据

    目录 精彩案例汇总 效果展示 一. 确定需求方案 1.确定产品上线部署的屏幕LED分辨率 2.功能模块 3.部署方式 二.整体架构设计 三.编码实现 (基于篇幅及可读性考虑,此处展示部分关键代码) 1 ...

  4. 【1】数据可视化:基于 Echarts + Python 实现的动态实时大屏 - 互联网企业数据

    目录 精彩案例汇总 效果展示 1.首先看动态效果图 2.再看实时分片数据图 一. 确定需求方案 1.确定产品上线部署的屏幕LED分辨率 2.功能模块 3.部署方式 二.整体架构设计 三.编码实现 (基 ...

  5. 【25】数据可视化:基于 Echarts + Python Flask框架动态实时大屏范例 - 企业宣传

    目录 效果展示 多主题样式 一. 确定需求方案 1.确定产品上线部署的屏幕分辨率 2.部署方式 二.整体架构设计 三.编码实现 (基于篇幅及可读性考虑,此处展示部分关键代码) 1.前端html代码 - ...

  6. 自从学了这种数据可视化,Echarts、Python、Excel从此是路人

    大家好,我是BAT的一名高级产品经理,最近忙着做一件事情,分析一款新产品的各项数据指标,为了找到增长点,完成OKR,拿到年终奖,我可是煞费苦心. 一边嫌弃Excel,自学Python和R,一边请我们的 ...

  7. 【4】数据可视化:基于 Echarts + Python 实现的动态实时大屏 - 厦门市某医院

    目录 精彩案例汇总 效果展示 1.首先看动态效果图 2.再看实时分片数据图 一. 确定需求方案 1.确定产品上线部署的屏幕LED分辨率 2.功能模块 3.部署方式 二.整体架构设计 三.编码实现 (基 ...

  8. 独家 | 数据科学家对可复用Python代码的实用管理方法(附链接)

    作者:Matthew Mayo, KDnuggets翻译:殷之涵校对:欧阳锦本文约3000字,建议阅读5分钟本文为大家介绍了四种关于复用Python代码的管理方法,以提高代码的效率及可读性等. 标签: ...

  9. python matplotlib数据可视化教程_matplotlib的Python数据可视化和探索——入门指南

    matplotlib--最受欢迎的Python库,用于数据可视化和探索 我喜欢在Python中使用matplotlib.这是我学会掌握的第一个可视化库,此后一直存在.matplotlib是最受欢迎的用 ...

  10. JAVA三维可视化组件:Matplot 3D for JAVA(V3.0) 一个纯JAVA开发的科学数据可视化组件包 类似 Python 的matplotlib(含示例代码)

    目录 概述 组件下载及项目地址 效果展示和示例代码 概述 Matplot3D for JAVA(V3.0) 是一个基于JAVA SE 1.8环境开发的三维图形图表组件. 组件由纯JAVA SE 实现( ...

最新文章

  1. LeetCode简单题之键盘行
  2. Redis第三集:redis-benchmark性能测试
  3. OpenResty 通过二级域名做跳转
  4. 面试官:为什么HTTPS是安全的
  5. java合并单元格同时导出excel
  6. As3.0与java数据类型的比较总结
  7. 视频数据复用光端机故障排除方法
  8. mysql awr 上海用户组_mysql awr v1.0.3修正说明以及发布
  9. 又不能起床python好学吗
  10. 「mysql优化专题」90%程序员面试都用得上的索引优化手册(5)
  11. redis 数据类型详解 以及 redis适用场景场合
  12. 如何用css进行网页布局,_技术笔记_课程笔记
  13. 对于os.walk()的认识--python遍历文件执行相应操作
  14. 态度决定一切细节决定成败_字体设计可以决定设计的成败:选择字体的过程
  15. js正则表达式校验值是否为一个数字(正负整数,正负小数均可校验)
  16. 资深美女基金经理首次分享基金知识,好评如潮!!!
  17. GitHub 上值得收藏的 100 个精选前端项目!
  18. 【PMP考试最新解读】第七版《PMBOK》应该如何备考?(含最新资料)
  19. Docker学习01---狂神说
  20. 评论:UiPath Aces机器人流程自动化

热门文章

  1. 深信服邮箱服务器,SANGFOR_aDesk_V5.2_云盘服务器部署指导.pdf
  2. 恶搞熊猫烧香 网友爆笑诗词句大集合
  3. 机器视觉软件哪个好?如何选择机器视觉软件?
  4. KBengine常见错误总结
  5. 学无止境·MySQL③
  6. ios 侧滑返回停顿_如何使用 iOS 系统自带侧滑返回功能
  7. vue-cli3添加eslint配置
  8. chatGPT的对手,Claude注册教程
  9. JAVA计算机毕业设计防疫宣传系统Mybatis+源码+数据库+lw文档+系统+调试部署
  10. Redis数据库目录