python echarts数据可视化

  • python echarts数据可视化实战
    • 引言
    • 词云分析
    • 柱状图分析
    • 饼图分析
    • 总结

python echarts数据可视化实战

引言

引言
上一章我给大家用一个简单的例子讲解了如何爬取特定网页上的大量岗位数据,并构造成数据集,那么有了数据集之后我们就可以对其做一些可视化的指标分析。
我们上一章爬取的就业岗位数据是存放在excel中的罗列的一条条数据:

那么对excel使用不熟悉的同学可能就面临难题了,怎么将这些数据进行不同维度的可视化分析,得到我们想要的结果呢,别急,我们慢慢来看。
可视化有很多工具可选择,它们都可以做到绚酷的可视化效果,例如市面上常见的echarts、tableau等,这么多工具我们往往会使用其中一两种就足矣应付日常工作需要解决的可视化任务,这里我们给大家使用一个简单好用的方法来展现可视化,那就是用python自带的pyecharts包,我们无需安装更多的可视化工具软件,即可轻松做到数据可视化分析。

词云分析

我们有了大量岗位数据之后,怎么对这些岗位有一个最直观的认识呢,词云就是一个不错的办法,“词云”的概念就是通过形成“关键词云层”或“关键词渲染”,对网络文本中出现频率较高的“关键词”的视觉上的突出。词云图过滤掉大量的文本信息,使浏览网页者只要一眼扫过文本就可以领略文本的主旨,那么我们来看一下如何对岗位名称这一字段来做词云可视化,具体的python代码如下:

# 引入pyecharts相关的包,并引入构建词云需要的包、引入读取csv文件需要的pandas包
from pyecharts import options as opts
from pyecharts.charts import WordCloud
from pyecharts.globals import SymbolType
import pandas as pd
# 读取岗位数据,统计不同岗位名称的词频
res = pd.read_csv('./test.csv')
a_name = list(res.岗位信息.value_counts().index)
a_count = res.岗位信息.value_counts().to_list()
# 将词频数据转换成构建词云需要的格式
a = zip(a_name,a_count)
words = []
for i in a:words.append(i)
# 使用WordCloud词云模块,链式调用配置,最终生成html文件
c = (WordCloud().add("", words, word_size_range=[20, 100], shape=SymbolType.DIAMOND).set_global_opts(title_opts=opts.TitleOpts(title="WordCloud-shape-diamond"))
)
c.render_notebook()

我们来看一下得到的岗位名称词云图:

从图中可以看出,客服、销售、储备类岗位比较多,我们爬取的网站其实是一所经贸学校的就业网站,可以词云图的结果也是符合经贸学校的定位的。

柱状图分析

分析岗位信息肯定要关注的一个指标就是薪资分布,那么我们来看一下如何通过柱状图观察一下不同薪资范围的分布情况,使用pyecharts做柱状图可视化的方法如下:

# 引入需要的pyecharts包
from pyecharts import options as opts
from pyecharts.charts import *
import pandas as pd
res = pd.read_csv('./test.csv')
# 薪资频率统计
x_index = list(res.薪资.value_counts().index)
y_value1 = res.薪资.value_counts().to_list()
# 设置柱状图
bar = (Bar().add_xaxis(x_index).add_yaxis("薪资", y_value1) # y轴设置.set_global_opts(title_opts=opts.TitleOpts(title="Bar-薪资", subtitle="数量")))
bar.render_notebook()

得到的柱状薪资分布图如下:

从图中可以看出,薪资区间在4500-5499范围等岗位数量是最多的,有300个。

饼图分析

刚刚我们通过词频可以分析出,数据集中数量最多的岗位是哪些,也通过柱状图可以得到不同薪资范围的岗位分布,那么我们如果想看不同类别岗位的占比呢,用上述两种图就不是很合适了,饼图可以很好的展现出不同类别的占比百分比情况,具有很强的直观性,饼图展示岗位占比的实现代码:

# 引入相关包
from pyecharts import options as opts
from pyecharts.charts import Page, Pie
import pandas as pd
# 读取数据并统计不同职位类别的频率
res = pd.read_csv('./test.csv')
x_index = list(res.职位类别.value_counts().index)
y_value1 = res.职位类别.value_counts().to_list()
# 作饼图
pie=(Pie().add("", [list(z) for z in zip(x_index, y_value1)]).set_global_opts(title_opts=opts.TitleOpts(title="饼")).set_series_opts(label_opts=opts.LabelOpts(formatter="{b}: {c}")))
pie.render_notebook()

作出的饼图效果:

可以看出销售客服类的占比最多。

总结

本章我们通过pyeharts工具包教大家如何做一些基本的可视化分析图表,当然这些都是可视化分析的开始,更复杂的场景和可视化还需要更深入的探究。
感谢您的阅读,如果您对博客内容的源码感兴趣,或者希望持续获得后续关于大数据分析的系列干货知识,可微信搜索“数据分析师进阶”或扫描以下二维码关注即可,公众号私信即可获取源码信息。

python echarts数据可视化实战相关推荐

  1. Python商业数据可视化实战

    序 言 目前,互联网全球化.移动设备普及化.物质世界网络化等,都在为"数据大爆发"储蓄能量,大数据已成为继云计算.物联网之后信息产业又一次颠覆性的技术变革.大数据时代正在变革着我们 ...

  2. python 豆瓣电影top250_豆瓣电影top250爬虫系列(三)--- python+Echarts数据可视化

    前两篇我们分别爬取了电影数据,也将爬取到的数据存到了数据库: 接下来我们要对现有的数据进行分析,已获得一些有效信息: 我这里只是进行了简单的可视化分析,运用Echarts插件生成各种图标: pytho ...

  3. Python使用tsne进行高维数据可视化实战:二维可视化、三维可视化

    Python使用tsne进行高维数据可视化实战:二维可视化.三维可视化 # 绘制二维可视化图像并添加标签字符函数 def plot_embedding(data, label, title):x_mi ...

  4. Python数据可视化实战——iris数据集可视化

    首先,这个Python数据可视化实战是在Iris数据集上完成的.所使用的是Python 3环境下的jupyter notebook. 实战中我们需要用到的库包括:pandas , matplotlib ...

  5. 大数据图书分享-Python数据可视化实战课程

    Python数据可视化实战课程内容以实践出发,全面地介绍了数据可视化流程和Python数据可视化的应用,并详细阐述了使用Python解决企业实际问题的方法. 全书设计思路以应用为导向,让用户明确如何利 ...

  6. 采用python爬虫爬取数据然后采用echarts数据可视化分析

    前言:采用python爬虫爬取天气数据然后采用echarts数据可视化画图分析未来天气变化趋势 从获取数据到可视化的流程 (熟悉爬虫爬取数据然后数据可视化这个过程) 一.python爬取未来8-15天 ...

  7. 第一本 ECharts 数据可视化书籍出版了!

    L说:这是朋友王大伟的著作,推荐大家购买. 我的第一本书终于出版了,书名叫做<ECharts数据可视化:入门.实战与进阶>,目前在当当.京东已经上架,可购买学习! 什么是ECharts E ...

  8. 一本 ECharts 数据可视化书籍

    对Echarts感兴趣的同学,给大家推荐一本很不错的书籍. PS:文末小z还给大家争取了两本的福利. Apache ECharts (incubating),下文简称ECharts,是由百度捐献给Ap ...

  9. 视频教程-Python大数据可视化-Python

    Python大数据可视化 7年软件开发架构经验,12年IT培训经验,曾就职于拜特科技,金蝶软件,软酷网络等多家互联网公司.擅长Java EE,前端,iOS及大数据等技术方向的开发及教学.策划并撰稿大数 ...

最新文章

  1. WindowsPhone基础琐碎总结-----数据绑定(一)
  2. Android四种启动模式
  3. 电脑回收站删除的文件怎么恢复,原来这么简单
  4. 学完计算机之后的感受,计算机教学心得心得体会
  5. 很火的仿soul交友盲盒1.0全开源源码
  6. PHP Zend Studio9.0怎么把代码搞成和服务器端的同步(就是直接在服务器端修改)
  7. 保存自动修复_CAD小技巧:怎样将自动保存的图形复原
  8. Docker Yearning + Inception SQL审核平台搭建
  9. java paint绘图添加组件不能显示_java – 为什么paintComponent没有在面板上绘图?
  10. 存储过程中SELECT INTO的使用
  11. SpringBoot整合RabbitMQ之Fanout Exchange扇形(广播式)交换机(学习总结)
  12. Pubg九月十六日服务器维护,绝地求生9月16日停机更新公告:绝地求生几点开始停机维护...
  13. JS 复习(6)JavaScript对象
  14. vue 一个动态链接url转成二维码
  15. 海量数据时代,磁带存储的“涅槃重生”
  16. android应用中自动化埋点的实现,Android 自动化埋点方案
  17. 找到一个非常智能的机器人接口分享出来。
  18. Android调用打印机
  19. 将 Flutter 应用程序连接到 BLE 设备并监听数据
  20. Sequencer: Deep LSTM for Image Classification(LSTM在CV领域杀出一条血路,完美超越Swin与ConvNeXt等前沿算法)

热门文章

  1. 【Hadoop】解决Hadoop Unable to load native-hadoop library问题
  2. 杭电ACM 2039: 三角形
  3. scrapy爬虫--苏宁图书
  4. C# 使用 OpenCV 剪切图片中的人物头像
  5. 苹果宣布iPhone 4S上市三天销量突破400万部
  6. lnmp 配置php,LNMP部署 thinkphp项目
  7. 矩阵论期末考试(一)
  8. 无线网络性能测试标准
  9. patch 的生成与合入
  10. HTML设置浏览器默认favicon.ico图标