经常有人会问我这样的问题:能不能做一个职业的可视化分析?最近找工作很不顺利,各种迷茫,希望从广大求职者的数据中得到一些启发。

肯定没问题,今天就给大家分析一波职业数据,以可视化的形式让各位感受一下数据的魅力。

众所周知,我们是做商业智能的,和这个行业强相关的岗位有很多,BI工程师算一个,我在某求职网站上随便搜索了一下,在这个寒冷的冬天,需求还挺大,而且薪资是很不错的,其中不乏腾讯、微博这样的知名大公司。

那我们现在就对这么多的数据进行可视化分析吧,其实很简单,只需要四步:

  • 获取有关“BI、数据”类的岗位数据包括:岗位名称、公司名称、工作地点、薪资、学历要求
  • 对数据进行预处理,包含数据去重,数据删选,数据规范化,数据分类等处理过程
  • 对不同的目标所需数据进行提取,再次进行数据处理过程,将数据进行可视化
  • 对可视化后的数据进行分析和得出结论

1、获取数据

由于所需数据量较大,本组利用python访问招聘网站,获取页面信息。技术是通用的,大家也可以试着获取自己岗位的关键词,如“报表工程师”、“java开发工程师 ”等。

至于完整的python代码,可以到文末获取,总计获取了10W的数据。

我们获取到了如下的数据明细:

由此可见,想要分析的角度很多,且看了源数据,还要做不少的数据处理,Excel和python肯定是不行的,前者是不能实时响应,后者是用户受众太窄。最简单快速出可视化的方法自然是用BI工具,来对数据做简单清洗加工,并呈现可视化。

BI能应付绝大多数场景的数据分析,尤其擅长多维数据切片,不需要建模;甚至数据清洗环节也能放在前端,通过过滤筛选、新建计算公式等来解决。最后呈现可视化,并可设计数据报告。

这里我用敏捷工具FineBI来做这次分析,它不仅能打通各类数据源,拖拽数据字段自动出图的操作方式,能让人从可视化的泥潭中解放出来,把更多精力投放到数据管理,算法研究和业务沟通上。

下图展示了FineBI强大的数据处理能力。

2、数据处理

海量的原始数据存在着大量不完整、不一致、有异常的数据,严重影响到数据进一步提取信息,因此要对所获取的数据进行处理。

导入数据

导入数据

主要是删除原始数据集中的无关数据、重复数据、平滑噪声数据,筛选掉与主题无关的数据,处理缺失值、异常值等。

将xlsx文件数据导入FineBI中(新建数据链接,建立一个分析业务包,然后导入这张excel表)。因为薪水是以xxk-xxk(还有一些类似校招/薪资面议的数据)的形式进行存储的,我这边使用FineBI新增公式列(类似excel函数)将这些字符进行分割:

薪水下限(数值): indexofarray ( split (salary,"k-") ,1)

薪水上限(含K字符):indexofarray( split(salary,"k-") ,2)

薪水上限(数值):left(薪水上限(文本),len(薪水上限(文本))-1 )

求一下平均薪水:(薪水上限+薪水下限)/2

3、数据可视化

要说可视化的颜值,finebi真的不输谁,内含50多种可视化图表:

下面这些图是我用30分钟就做出来的:

要知道同样的工作使用R语言的ggplot2至少要2小时(含调试),使用Python的matplotlib就更久了。

4、得出结论

通过FineBI,我做出了如下的可视化驾驶舱:

根据上面这个图表,我可以分析出很多有价值的结论:

(1)这种数据类型的新兴职业,大部分存在于互联网公司中,所以互联网发达的地方:北上广深,也就是该岗位需求最多的地方。

(2)目前BI工程师岗位平均薪资为20.61K,主要薪水区间大概在15K-20K和大于25K,而这个薪资对应的年限大致在3年以上,本科学历。

(3)同一岗位,本科和硕士的薪资差很多,所以还是要努力读书

(4)一些高薪的招聘企业,最高的可以给到40K~60K的薪酬水平,其中主要是互联网、IT类公司为主。

相比于前几年,数据类岗位,无论从整体薪资还是需求数量来看,都有了大幅度的上涨,今年开始数据被纳入参与分配的生产要素,数据开始起着越来越重要的作用。

这个工具,可视化分析10W数据后,找到了数据岗位月薪20K的秘诀相关推荐

  1. R语言ggplot2可视化:使用pracma包的interp1函数对缺失值进行线性插值后进行可视化分析、用虚线标记进行数据填充的区域

    R语言ggplot2可视化:使用pracma包的interp1函数对缺失值进行线性插值后进行可视化分析.用虚线标记进行数据填充的区域 目录

  2. 【Windows 逆向】OD 调试器工具 ( CE 工具通过查找访问的方式找到子弹数据基地址 | 使用 OD 工具附加游戏进程 | 在 OD 工具中查看子弹数据地址 | 推荐 )

    文章目录 前言 一.CE 工具通过查找访问的方式找到子弹数据基地址 二.使用 OD 工具附加游戏进程 三.在 OD 工具中查看 058E2F1C 地址数据 前言 上一篇博客 [Windows 逆向]O ...

  3. 【Windows 逆向】OD 调试器工具 ( CE 工具通过查找访问的方式找到子弹数据基地址 | 使用 OD 工具附加游戏进程 | 在 OD 工具中查看 05869544 地址数据 | 仅做参考 )

    文章目录 一.CE 工具通过查找访问的方式找到子弹数据基地址 二.使用 OD 工具附加游戏进程 三.在 OD 工具中查看 05869544 地址数据 一.CE 工具通过查找访问的方式找到子弹数据基地址 ...

  4. 用Python可视化分析绝地求生上万场游戏数据,教你做最强吃鸡攻略啦~

    导语 大吉大利,今晚吃鸡~ 今天跟朋友玩了几把吃鸡,经历了各种死法,还被嘲笑说论女生吃鸡的100种死法,比如被拳头抡死.跳伞落到房顶边缘摔死 .把吃鸡玩成飞车被车技秀死.被队友用燃烧瓶烧死的.这种游戏 ...

  5. python可视化分析网易云音乐评论_Python数据可视化:网易云音乐歌单

    通过Python对网易云音乐华语歌单数据的获取,对华语歌单数据进行可视化分析. 可视化库不采用pyecharts,来点新东西. 使用matplotlib可视化库,利用这个底层库来进行可视化展示. 推荐 ...

  6. Excel2019选择数据后,指定数据作为x轴

    1.选择数据后,在制作图表过程中,出现了两条曲线 2.右键点击图表,点击选择数据,可以发现有两个系列而实际上只需要一类数据 3.系列一为第一行数据,系列二为第二行数据,删除系列一,可以发现系列一的数据 ...

  7. JDBC插入数据后返回新数据id

    使用jdbc向表中插入数据时,有时候需要返回新插入数据的id.比如现在要向两个表中分别插入一条数据,第一条数据插入后生成的id要作为第二条数据的一个字段值. 具体代码: PreparedStateme ...

  8. 在mysql中删除数据后,添加数据,id值依然从删除的位置开始增加,问题详解。

    +----+--------------+-----+----------------------+----------+ | id | name | age | email | isActive | ...

  9. MYSQL数据库删除数据后重新插入数据 id不连续问题

    问题:在删除自增id的表的数据后,再次添加数据会从上次添加的最后一个id开始自增. 解决办法: 重置自增ID sql: alter table 表名 auto_increment=数字 //设置sys ...

最新文章

  1. C++编译期多态与运行期多态
  2. 兼容ie跟谷歌上传文件
  3. 算法图解学习笔记01:二分查找大O表示法
  4. Java中的NIO非阻塞编程
  5. 爬虫学习一:HTTP、网页基础、requests、API、JS
  6. 介绍一种新的激活函数族ACON
  7. Android使用ksoap2调用C#中的webservice实现图像上传
  8. redis数据类型-列表(List)
  9. zabbix通过UNIXODBC连接数据库
  10. smart原则_OKR 文化:用 SMART 原则量化目标
  11. ImageJ -介绍与安装
  12. JavaScript刷新和跳转
  13. QT等待动态图gif加载透明背景lable
  14. 实现Excel下拉自动填补对应内容到后面单元格
  15. 多级指针—为快捷方式创建快捷方式
  16. dns备用服务器信息,dns服务器地址(dns首选和备用填多少)
  17. VIVO应用市场APP上架总结
  18. 网络工程管理 第四章 路由器 RIP OSPF 及配置实验
  19. npm 包解析 eml 文件
  20. IKBC_DC-108 改装,加灯,加锂电池和充电

热门文章

  1. html退出登录_退出登录 0152
  2. rdlc tablix_SQL Server中的报表–通过分组功能(由Tablix控件提供)处理数据
  3. sql azure 语法_什么是Azure SQL Cosmos DB?
  4. ssis组件_使用SSIS Hadoop组件连接到Apache Hive和Apache Pig
  5. BZOJ 3261: 最大异或和位置-贪心+可持久化01Trie树
  6. html 5实用特性之data属性
  7. 夺命雷公狗---DEDECMS----14dedecms首页导航条的完成
  8. TAOCP-1.2.10_求极大值
  9. 帆软报表,报错:sql注入攻击问题
  10. [Lintcode]102. Linked List Cycle/[Leetcode]