前言

本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。

作者:CPDA数据说

喜欢的朋友欢迎关注小编,除了分享技术文章之外还有很多福利,私信“学习资料”可以领取包括不限于Python实战演练、PDF电子文档、面试集锦、学习资料等。

常言道,一入数分深似海...

本文将以数据分析的方式对这个行业展开调研,尽可能让正在从事或有兴趣想加入这个行业的小伙伴们对于当前数据行业的就业环境有更深入的了解和认识。

项目流程数据获取:访问前程无忧官网,找出需用作数据分析的数据并进行获取

数据预处理:对获取数据进行去重、缺失值处理等一系列数据清洗操作

数据可视化:文字不如数据,数据不如图片,可视化是对于数据最好的展现方式,让人一目了然

深入分析:对于数据深入分析,寻找不同因素与薪资之间的关系

项目实施

1.数据获取

在搜索数据的时候,岗位关键词我选择的是数据分析师,这是因为其他的岗位关键词匹配度过低,搜索结果包含大量无效数据,而数据分析师匹配度高。地点选择了全国,是因为我想分析全国不同城市对于数据分析师岗位的需求量以及薪资水平。

在爬取的时候,我选择从二级页面爬取,目的是为了获得更多的信息,以便后续能从更多的维度进行分析。抓取维度为:公司名字、类型、规模、行业、地点、福利、职位信息(职责、学历、技能、经验、薪资)。

最后一共获取8076条数据。

2.数据预处理

因部分数据内容与数据分析岗位无任何关系,故将不匹配数据剔除。我的判定方式是将工作名称中包含"数据"、"分析"、"Data"、"Analyst"中任何一个关键词的保留,四个关键词一次都没有出现的则剔除。共剔除1261条与数据分析无关的数据。

由于有部分的数据内容存在重复,故选出其中岗位描述相似度较高的数据,将这些数据直接剔除。共剔除567条重复数据。

爬取的时候要求字段里包含工作地点、工作经验、学历、招聘人数以及招聘日期等数据,将数据分列,并保留工作地点、工作经验、经历三个字段,删除招聘人数以及招聘日期字段。

分列完成后有1000余条数据并未明确学历要求,但在岗位描述中有提及相应学历要求,我找出了这些数据,并完善了约600条余条数据。另外有2000余条数据对于工作经验无要求,但部分数据在岗位描述中对于经验要求有所提及,操作方法与前者类似,完善了500余条数据。

处理前数据:

处理后数据:

由于福利字段内包含较多数据,故将数据进行分列,并用数据透视表的方式将相关福利字段内相应福利出现的频数进行统计,方便后期可视化的时候绘制词云。

处理前数据:

处理后数据:

行业类型的字段内包含多个行业,不利于后期对于行业的分析,故我只选择选取每条数据的第一级的行业类型,并将多余数据进行剔除。

处理前数据:

处理后数据:

工资字段内的数据是一个收入的区间值,时间单位有小时、天、月、年,计价单位有千和万,我选择把收入下区间与收入上区间进行拆分,并将不同的时间单位与计价单位进行单位统一,数据统一为"XXXX"元/月的格式。另外,我把收入按照从高到低的方式进行划分、归类并增加平均工资的字段,方便后期可视化操作。

处理前数据:

处理后数据:

对要求中需要用到的相关数据分析的技能进行统计,以方便后期观察各岗位对于技能树的要求。处理结果如下图所示(1代表需要,0代表不需要)。

至此,数据预处理工作基本完成,清洗后数据共计6060条。

3.数据可视化

(1)薪资分布情况

从分布情况可以看出,数据分析师岗位的月薪集中在5000-8000元/月以及8000-12000元/月这两个区间段,从12000元/月-25000元/月中间的这三个区间段也是数据比较集中的区域,说明这个行业具有一定的发展空间和潜力。

(2)各城市岗位数量分布情况

从如下两图可以看出,数据分析师的工作机会最多的城市是上海、广州、北京、深圳这四个超一线城市,杭州、成都、武汉、南京等一线城市紧随其后。

(3)学历要求情况

从下图看出,数据分析师岗位对于学历要求最多的是本科和大专,这两个学历的比重占到了全部数据的85.39%,可以看出数据分析师对于学历的要求比较宽松,当然如果是硕士甚至是博士学历会意味着你会有更多的选择,更好的机会和更高的收入。

(4)工作经验要求情况

从下图看出,数据分析师岗位对于工作经验要求最多的是1年经验、2年经验以及3-4年经验,1-4年的工作经验要求占到了所有数据的91.11%。近些年科学技术的突飞猛进,得益于互联网和智能手机的发展,数据分析、大数据和人工智能行业逐渐兴起,因兴起时间较短,所以数据分析师岗位对于工作经验的要求比较友好。

(5)技能要求情况

从下图看出,数据分析师对于从业者有一定的技能的要求,除去大家比较熟悉的excel之外,掌握数据库语言(sql)也是必备的技能。编程语言也是数据分析师需要点亮的技能树之一,其中以Python、R和Sas最为常见。当然如果你会挖掘、算法或者模型,无疑则是锦上添花。

(6)行业分布情况

从下图看出,对于数据分析师需求量最多的三个行业分别是互联网、计算机以及金融,而服装、通信以及快消等传统行业紧随其后。

(7)公司类型分布情况

从下图中看出,对于数据分析师需求最多是民营企业,占比到达了63.66%。另外国企、上市公司、合资公司以及外资企业对于数据分析师的需求度平分秋色,各占10%左右。

(8)公司规模分布情况

从下图可以看出,需求数据分析师的公司规模集中在50人-500人左右,这些公司大多以民营公司或者创业公司为主。

(9)企业福利情况

企业福利情况也是各位求职的小伙伴非常关心的要素之一,这么多福利中有没有哪些是让你非常心动的呢?

4.深入分析

(1)数据说明

我所关心的因变量Y是数据分析师收入水平(元/月)。数据分析师的收入水平是多种因素综合作用的结果,我共收集了前程无忧网站的6060条与数据分析相关的数据,想对于数据分析师收入水平的相关影响因素进行更加深入的研究。

数据包括工作地点、学历、工作经验等5个变量,数据说明如下图所示。

(2)工资收入

从如下直方图可以看出,工资收入呈现右偏态分布,工资收入的均值为12008元/月,中位数为10000元/月。这一现象符合我们对于工资的基本认知,即存在少数高收入工作,从而拉高了工资的平均水平。

在本案例中,工资收入的最小值为1300元/月,所对应的工作是南京数据分析实习员;最大值为85000元/月,所对应的工作是杭州的高级数据分析师。

(3)描述性分析

首先看学历因素以及工作经验因素,从分组箱线图中可以看出,学历以及工作经验对于工资收入的影响明显,存在一定的正相关。

再看公司类型因素,从分组箱线图可以看出,除去事业单位的工资收入水平明显偏高之外,其他公司类型的工资收入都比较接近。

接着来看行业类型以及工作地点因素,从分组箱线图可以看出,不同行业类型之间的工资收入水平比较接近,而在工作地点方面,上海、北京以及深圳的工资收入水平偏高。

综上所述,通过对数据的描述性分析,可以得出结论:对工资收入产生影响较大的因素包括学历、工作经验和工作地点。

项目总结

通过这次对于“数据分析师”岗位的调研,相信各位小伙伴对于这个行业有了一些不同的了解和认识。虽然数据分析岗位的门槛比较友好,但是想要在这个行业有一个长远的发展,想要成为一名合格乃至优秀的数据分析师,除了需要不断积累、学习各种技能和知识以外,还要多思考,多总结,不断培养自己的数据思维以及分析能力,只有这样才能让自己在众人之中能够脱颖而出。漫漫长路,砥砺前行!

python案例分析大学生薪资_Python数据分析实战:解密数据分析师的薪资和需求相关推荐

  1. python朋友圈点赞统计_Python数据分析实战案例:统计分析微信朋友圈数据(附实操视频)...

    原标题:Python数据分析实战案例:统计分析微信朋友圈数据(附实操视频) 本文内容将通过一个具体实例讲解将朋友圈数据导出为JSON文件的方法,并介绍使用Python统计分析JSON数据的过程. 注: ...

  2. python案例分析大学生薪资_Python数据分析的案例。。

    本文来源于数据<Python数据分析>动物书 .. 分享一下电子版本的下载地址: git@github.com:hashmapybx/learn_python.git  这里可以下载到对应 ...

  3. python 股票分析常用库_Python数据分析常用库有哪些?Python学习!

    Python为什么受欢迎?因为Python简单.易懂.好用,是一门高级的编程语言;除此之外,Python提供了大量的第三方库,开箱即用,方便.免费,非常适合从事数据分析领域的工作. 大家也都知道,Py ...

  4. python如何分析高频词_python数据分析高频词提取,pyecharts词云制作并保存

    import pandas as pd import jieba import jieba.analyse filename = "E:\\数据处理\\隐患类型.txt" #载入数 ...

  5. python中df是什么_python数据分析之pandas数据选取:df[] df.loc[] df.iloc[] df.ix[] df.at[] df.iat[]...

    1 引言 Pandas是作为Python数据分析著名的工具包,提供了多种数据选取的方法,方便实用.本文主要介绍Pandas的几种数据选取的方法. Pandas中,数据主要保存为Dataframe和Se ...

  6. RFM模型的理解和python案例分析

    RFM模型是什么 RFM是客户关系管理(CRM:Customer Relationship Management)中一种重要的分析模型,通过研究一个客户的交易时间.交易频率和交易总金额来衡量客户的价值 ...

  7. 《数学建模:基于R》一一1.7 数学建模案例分析——食品质量安全抽检数据分析...

    本节书摘来自华章计算机<数学建模:基于R>一书中的第1章,第1.7节,作者:薛 毅 更多章节内容可以访问云栖社区"华章计算机"公众号查看. 1.7 数学建模案例分析-- ...

  8. mysql数据生产数据分析_基于MySQL玩转SQL数据分析课程 互联网数据分析师-SQL数据分析实战视频教程...

    基于MySQL玩转SQL数据分析课程 互联网数据分析师-SQL数据分析实战视频教程 课程目录 (1)SQL与数Ju分析;目录中文件数:23个 (1) 开课-课时3SQL与数Ju库的价值.flv (2) ...

  9. 一线城市数据分析师的薪资分布......

    写这篇文章的时候,边写边扎着心,数据分析师高薪的还不少呢! 大家只知道自己的薪资水平,那么自己的薪资在一线城市中又处于什么样的位置呢?我整理了下BOSS直聘的数据分析师薪资样本数据,也调研了下以前认识 ...

最新文章

  1. gcc/g++命令参数笔记
  2. Spring boot的put请求
  3. 使用ABP打造SAAS系统(2)——前端框架选择
  4. jsp- el表达式
  5. 小米路由器mini WOL网络唤醒插件
  6. 基于Montgomery算法的高速、可配置 RSA密码IP核硬件设计系列(三)——抵抗侧信道攻击设计方案
  7. 解决VuePHP跨域请求
  8. win7计算机锁频图片怎么设置,win7锁屏背景壁纸如何修改
  9. jspsmartupload简述
  10. 微信公众号怎么发送模板消息 微信公众平台模板消息免费发送的技巧
  11. python生成epub文件_将'epub'文件转换为文本
  12. ajax.googleapis firefox,使用Redirector插件解决googleapis公共库加载的问题【转】
  13. 4.1 图像的几种色彩模式 [原创Ps教程]
  14. 浏览器调取摄像头人脸抓拍实现
  15. jQuery详解(二) 函数和事件
  16. 10.setTimeout和setInterval的区别以及模拟实现:
  17. windows 安装汽车之家falcon插件 采集数据
  18. 手工纸盒子_折纸盒子大全_10多种折纸盒子制作图解教程|怎么折纸盒子 - 聚巧网...
  19. logisim 文档
  20. jquery.slimscroll.js 插件库的应用

热门文章

  1. matlab projinv,有没有大神救救孩子?
  2. lingo学习笔记(1)lingo基础篇
  3. STM32选型手册及命名规则
  4. Fiddler安装教程
  5. 安装Altium Designer失败
  6. DXC简介——HANA数据抽取和同步
  7. 关于RSA的几种攻击手段
  8. 问卷调查(20145326蔡馨熠)
  9. 24届河南理工大学计算机考研分析
  10. 应用开发图像识别之经典方法