1.研究背景

由于很多公司都需要数据分析,所以就想研究一下最近比较火热的岗位,希望通过本文的分析能够给广大求职者一个借鉴。

2.分析思路

(1)明确分析思路

想要了解数据分析类岗位招聘现状,可以从一下几个维度去进行现状下描述性分析:

招聘数据分析的公司有哪些特点?——公司基本信息

招聘薪酬待遇如何?——职位基本信息

招聘有什么要求?——职位要求信息

(2)搭建指标分析体系

针对以上分析维度问题搭建维度指标体系

3.数据采集

(1)采集工具

在八爪鱼采集器或者python爬虫。

(2)数据来源

采集拉勾网“数据分析”岗位,具体操作可从网络上学会。

4.数据清洗

(1)数据预处理

第一步 先备份数据,隐藏不需要的列,修改列名。

第二步 理解表中行列数据,观察数据有没有缺失值,有无错位,或者一些影响分析的脏数据,根据相关的观察并处理数据。

第三步 经过上一步的的简单清洗 ,心中应该有此数据元清洗加工的大致方向。

(2)数据清洗

a 处理重复值

在excel数据-删除重复值,检测到78条重复项,故删除。

b 处理缺失值

查看计算每列是否存在缺失值,如果一个字段数据确实超过40%,就要考虑删除重新获取数据或作其他措施。通过数据发现该数据并没有缺失值,所以无需处理。

c 处理异常值

公司所在地区是城市加地区,需将它们进行分析才能刚好地进行分析。利用分列功能将他们进行分列,并查看数据是否规范。

d 数据加工

观察到薪资列为文本数据,将其转换为数值型。通过观察数据,可以看到这列数据都有一个共同的特质,都是XXk-XXk。可以通过分列将数据分为最低工资和最高工资,替换k,就可以将数据变成数值了。

提取后的部分数据如图所示

5.数据可视化

(1)招聘公司分析

招聘数据分析的公司有什么特点呢?主要从招聘公司所在地区、公司规模,以及公司所属行业等维度指标来进行分析。

a 招聘的公司主要分布在那些城市?

从上述结果来看,北京是数据分析岗位占比最大的,占比高达30%,其次是上海,占比也到了26%,再然后就是深圳、广州、杭州、成都。其他城市的需求较少。

b 招聘企业都属于那些规模?

由此可知,公司规模越大,招聘的数据分析职位就越多。符合企业规模越大,产生的数据量级越大的一般规律 ,数据分析/挖掘的需求也越旺盛 。

从以上结果可以了解到,数据服务是招聘数据分析岗位最多的行业,其次就是金融/游戏/电商等行业是招聘数据分析的主要行业,如果大家需要选择行业的话,也可以以此为参考。

以便于同时观看城市和行业对招聘的需求影响,且由于数据比较分散,故通过城市筛选出北上广深杭五个城市。

(2)薪资待遇分析

招聘的薪资待遇如何呢?一般通过城市、行业、学历、经验等密切相关,针对不同的影响因子,进行简单的描述性分析。

a 城市的不同,对需求和薪资的影响分布

由上述结果可知,香港的薪资最高,但是企业所招聘的数量较少。而对于北京、广州、深圳、上海、杭州的招聘数量较多,薪资水平也不低。

b 行业的不同,对薪资的影响的状况?

标出行业前10%的数据,以便于更好地进行分析。除了电商平台和内容咨询这两个行业,其他行业薪资前10%的行业大多都是招聘数量较少的行业,例如薪资最高的区块链行业,岗位招聘的占比才0.27%。所以说热门做数据分析的行业薪资不一定是最高,但是也不会差到哪里去,从数据上看,反而是冷门的行业做数据分析反而薪资最高。

c 经验与学历的不同,对薪资的影响

在不限经验的时候,博士的工资在几个学历中是最高的,5-10年经验的本科和硕士的工资在25-30k,1年以下的薪资最低。1-3年和在校的薪资都差不多,10年以上经验的硕士工资最高。由此看来,工作经验的提升和学历的提高,薪资待遇也会越来越高。

(2)岗位要求

招聘岗位有什么要求呢?主要从工作经验、学历、软件技能等维度进行分析,但由于数据中没有软件技能的数据,所以只对工作经验和学历进行分析。

a 经验的不同,对需求和薪水的影响

经验 平均值项:平均工资 计数项:招聘岗位
10年以上 45 0.27%
1-3年 16.92553191 25.47%
1年以下 14.6 1.36%
3-5年 24.06462585 39.84%
5-10年 29.74489796 13.28%
不限 22.68181818 14.91%
在校 17.41666667 4.88%
总计 22.39837398 100.00%

符合一般规律:基本上符合工作经验越高,薪资越高。工作经验3年以下的占比高达50%以上,说明该行业对对求职者的工作经验是比较包容的。

b 学历的不同,对需求的薪资的影响

学历 平均值项:平均工资 计数项:招聘岗位
本科 22.85648148 87.80%
博士 45 0.27%
不限 26 1.90%
大专 11.9375 2.17%
硕士 20.31818182 2.98%
应届 17.41666667 4.88%
总计 22.39837398 100.00%

该岗位对本科的招聘数据达到了87.8%,在各项数据中相对占优势的硕士学历占比为2.98%,说明数据分析岗位对学历的要求标准为本科。且本科和硕士的薪资相差不大明显,也就是新兴的岗位学历要求不高,对求职者是利好的消息。

6.总结

各城市的岗位需求北京>上海>广州>深圳>杭州>成都,可以按照以上顺序去找工作,在以上顺序下也可以按照数据>服务金融>游戏>电商顺序去找工作,比较好找。

从招聘需求和薪资来看,招聘本科的需求占87.8%,工作经验也主要集中在1-5年经验,并且经验的积累是明显大于学历提升对薪资的影响。建议重点提升自我的工作经验和能力。

不足之处在于没有抓取到职位的软件技能,其实对于初级数据分析师,excel可以解决80%的问题;对于中高级数据分析师,后期必须多积累经验并掌握编程工具:sql、tableau、python等。

数据来源于拉勾网,而拉勾网是比较偏向互联网招聘 ,可能会影响城市/行业/薪资的需求分布,以上也仅仅作一个参考。

基于excel的数据分析相关推荐

  1. 《数据分析实战:基于EXCEL和SPSS系列工具的实践》——3.3 耗时耗力的数据整理过程...

    本节书摘来自华章计算机<数据分析实战:基于EXCEL和SPSS系列工具的实践>一书中的第3章,第3.3节,作者 纪贺元,更多章节内容可以访问云栖社区"华章计算机"公众号 ...

  2. 《数据分析实战 基于EXCEL和SPSS系列工具的实践》一3.4 数据量太大了怎么办

    本节书摘来自华章出版社<数据分析实战 基于EXCEL和SPSS系列工具的实践>一书中的第3章,第3.4节,纪贺元 著,更多章节内容可以访问云栖社区"华章计算机"公众号查 ...

  3. 《数据分析实战 基于EXCEL和SPSS系列工具的实践》一第2章 数据分析的理论、工具、模型...

    本节书摘来自华章出版社<数据分析实战 基于EXCEL和SPSS系列工具的实践>一书中的第2章,第2.1节,纪贺元 著,更多章节内容可以访问云栖社区"华章计算机"公众号查 ...

  4. 《数据分析实战:基于EXCEL和SPSS系列工具的实践》一3.4 数据量太大了怎么办

    本节书摘来华章计算机<数据分析实战:基于EXCEL和SPSS系列工具的实践>一书中的第3章 ,第3.4节,纪贺元 著 更多章节内容可以访问云栖社区"华章计算机"公众号查 ...

  5. 《数据分析实战 基于EXCEL和SPSS系列工具的实践》一3.2 用“逐步推进法”推测需要的数据...

    本节书摘来自华章出版社<数据分析实战 基于EXCEL和SPSS系列工具的实践>一书中的第3章,第3.2节,纪贺元 著,更多章节内容可以访问云栖社区"华章计算机"公众号查 ...

  6. 2020年最强悍的EXCEL插件!基于EXCEL的云端数据分析平台

    EXCEL一直是非常流行的个人计算机数据处理工具,它可以处理多种多样的数据,操作非常简单,支持丰富的函数.统计图表,在工作中更是非常得力的生产力工具.然而随着时代的不断演进,现如今由于大家对于数据工具 ...

  7. 《数据分析实战:基于EXCEL和SPSS系列工具的实践》——2.3 在分析需求和模型之间搭起桥梁...

    本节书摘来自华章计算机<数据分析实战:基于EXCEL和SPSS系列工具的实践>一书中的第2章,第2.3节,作者 纪贺元,更多章节内容可以访问云栖社区"华章计算机"公众号 ...

  8. [论文阅读] (26) 基于Excel可视化分析的论文实验图表绘制总结——以电影市场为例

    <娜璋带你读论文>系列主要是督促自己阅读优秀论文及听取学术讲座,并分享给大家,希望您喜欢.由于作者的英文水平和学术能力不高,需要不断提升,所以还请大家批评指正,非常欢迎大家给我留言评论,学 ...

  9. R与Excel之数据分析

    R与Excel之数据分析 Excel 是一款很好用的数据分析工具,但是你分析数据时只有 Excel 这一款工具的话,则会大大影响工作效率.相比之下,R 工具更好用,而且提供的工具集模块更完整. 我从事 ...

最新文章

  1. 听说这是写毕业论文的你?
  2. SSRS配置2:加密管理
  3. python 7-10梦想的度假胜地_7-8----7-10练习
  4. python多变量拟合_python-使用scipy拟合多个参数曲线
  5. 费氏搜寻法之算法分析与实现
  6. 【计算机系统设计】实践笔记(2)数据通路构建:第一类R型指令分析(1)
  7. 永磁直驱风力发电机结构图_国内首台10MW海上永磁直驱风力发电机研制成功
  8. 北京大学c语言试题及答案,北大网络教育(计算机专业)C程序设计作业答案
  9. ios开发 方形到圆的动画_使用UIBezierPath画个圆动画
  10. 【Oracle】用户管理
  11. 计算机操作基础知识点总结
  12. 本来共享的计算机突然无法访问,WIN7局域网无法启用共享访问解决办法
  13. FPGA源同步时钟输出
  14. 第6章 索引和数据完整性
  15. Golang源码探索----GC的实现原理(3)
  16. 苹果14pro Max来了,做第一批吃蟹人
  17. 游戏服务器开发技术小结
  18. CNN网络架构学习:Chapter-5-ResNet(附代码tensorflow)
  19. 杭电多校第六场个人补题6 7 9 10 12
  20. 如何执行存储过程以及如何进行调试?

热门文章

  1. C# 中的委托和事件[转自张子扬]
  2. 【学生管理系统】班级管理
  3. 为什么Axios中获取不到Content-Type
  4. OpenCV初试云雨
  5. 如何使用Mezzanine
  6. 《一网打尽:贝佐斯与亚马逊时代》的推荐及推荐书单
  7. sql升序null排在顶部
  8. git push报错 protocol error: bad line length character: Acti
  9. CAAI演讲实录丨李德毅院士:交互认知——从图灵测试的漏洞谈开去
  10. pygame的游戏窗口退出办法