excel-拉勾网上海数据运营岗位招聘分析
本文原始数据来自于拉勾网以上海区域数据运营岗为关键字搜索爬虫而来,为保证数据时效性,筛选了20200508-20200606期间的数据,分析的目的主要是在后续求职时给自己一个市场预期以及个人决策上的指导,以下是本次分析关注的主要问题:
1、疫情期间,数据运营岗位招聘需求变化如何,市场需求量大吗?
2、数据运营岗位招聘的总体现状如何?
如:学历要求,工作经验要求,行业分布等等
3、数据分析的薪资分布如何,行业平均薪资之间会有差异吗,差异多大呢
【数据分析过程】
1、数据清洗
以下为爬取数据后的原始数据集
经过一系列拆分和数据清洗,数据被整理成以下形式:
数据清洗过程总结如下:
清洗难点主要有:
①爬虫导出来的数据格式如若要放在excel中处理,最好用csv格式,xlsx导出后容易有bug
②csv格式下爬虫出来的结果仍然有很多特殊的地方,例如文本会有特殊符号,可以用clean()函数清楚不可打印的字符
③发布日期的计算和格式统一;擅于观察数据的大致形貌,善用替换功能做初步清洗,然后用文本函数提取出需要的内容
常见文本函数,find和midleft搭配,
补充小技巧:统计一个单元格内字符串包含某个字符的个数,可用len(单元格)-len(substitute(单元格,'/',"")) 思路就是总字符减去替换掉这个字符为空时的值即为字符串出现的次数
④擅于用辅助列的思维,辅助列和排序功能相结合有时候能发挥出很强大的效果
习惯方面:
①准备清洗之前,确定主要分析思路,大致清洗需要的数据分析字段,避免遗漏爬取重要字段
②数据清洗过程中要有两个文件,一个是结果集,一个是草稿集,便于追溯之前统计的结果
2、数据分析过程
(1)确认数据运营岗位需求变化情况
上图中时间轴为岗位发布时间,纵轴为岗位数量,
从需求岗位数量的变化情况来看,对比5月25到5月30号,近一周岗位发布数量明显增多,本周比上周岗位增长43%,仅数据运营相关岗位在拉钩上就有80个,市场回暖迹象明显,求职要有信心鸭
上周岗位数量 | 本周岗位数量 |
56 | 80 |
其中每周三-周五期间发布岗位最多,这时记得保持关注,锚定好目标行业和岗位,在周末的时候加紧充电,准备下周可能的面试,结合hr工作习惯,周二、周三比较适合投递简历
(2)数据运营岗位招聘总体现状(从招聘学历要求,行业分布和薪资分布三个角度来看)
①学历要求
爬取的137条数据中,本科学历要求占大多数,约85%,仅有一条需要硕士学历,说明数据运营岗位对学历要求没有很高
②经验要求
经验年限 | 岗位数量 | 平均工资(k) |
10年以上 | 3 | 40.00 |
5-10年 | 23 | 30.04 |
3-5年 | 60 | 20.61 |
不限 | 15 | 15.10 |
1-3年 | 26 | 13.04 |
1年以下 | 3 | 9.67 |
应届毕业生 | 7 | 5.21 |
结论:
- 工资分布和经验是很相关的,运营方面经验越丰富,岗位薪酬越高
- 结合自身情况,工作1年左右薪资约在10k左右
③岗位行业情况
行业分布情况
结合自身工作经验为1-3年,所以后续为专门筛选出了经验要求为不限,1-3年,和1年以下的数据,用于分析决策
ps:发现一个问题,拉钩网上很多为了分类方便,很多行业选择的很笼统,比如直接选择移动互联网(其实可以细分为电商,文娱等),但没有细分行业,图中数据已经结合企业标签字段数据,尽量保证行业细分的准确性,但依然会有不准确的现象存在,加之数据集数量不多,仅作为个人参考,不代表真实市场情况
结论:1、电商需求没有我想象的那么火热,需求程度处在中层水平
2、金融,文娱(b站和喜马拉雅),企业文娱排于前三,教育以及游戏出乎意料需求还ok,可以保持关注
④行业薪资分布情况
承接上文,在筛选了经验为不限、1年以下、1-3年的数据之后,所有岗位的平均薪资为15.89k(主要是字节爸爸拉高了薪资水平),上图黄色区域代表超过了平均薪资的行业,移动互联网,游戏,教育等行业平均薪资大于总体平均水平(消费生活,医疗等数据集仅有1个,作为特殊情况处理未纳入考虑范围内)
结合岗位行业需求情况和薪资分布情况,初步得出移动互联,游戏,教育,电商行业可以作为主要攻略目标
excel-拉勾网上海数据运营岗位招聘分析相关推荐
- Python数据可视化 - 使用Dash库制作杭州数据分析师岗位招聘情况可交互网页报告(附代码下载)
dash dash不同于flask或者Django,具备少量的前端知识即可制作可视化网页,下图为本人制作的数据分析师岗位招聘情况可视化网页. 文末附网盘下载经过清洗后的数据与可视化网页的代码. 交互 ...
- java爬取网页数据_利用Python做数据分析—对前程无忧数据类岗位进行分析
引言 随着时代的发展,我国在各行各业都需要大量的人才引进,处于近几年最热门的行业也称"最火行业":大数据.数据分析.数据挖掘.机器学习.人工智能,这五门行业各有不同又互有穿插.近几 ...
- 深圳市“数据分析”岗位招聘分析—基于拉勾网
项目说明 该项目的数据来源于2021年9月11日在拉勾网搜索"数据分析",爬取的岗位信息.通过这些数据,主要回答以下几个问题: 1.各区对数据分析岗位的需求情况 2.各行业对数据分 ...
- 拉勾网职位数据爬取与分析(一)
写在前面:开始数据挖掘的学习已有一段时间,由于研究生阶段一直使用C++,代码的熟练度还远远不够,对算法的理解也不够深刻.因此,想要写点东西记录自己学习的过程,希望可以在积累中不断提升自己. 今天写一写 ...
- 数据分析案例-数据分析师岗位招聘信息可视化
- 人力资源数据分析 - case 分析拉钩数据分析师岗位
一.背景 本人5年工作经验,服务同一家公司,也一直在与数据打交道.曾在XX事业部-业务策略中心带数据小组,进行扩店策略.门店运营和经营指标体系建设.目前在我司研究院做BI.数据挖掘.近期正在寻求改变, ...
- 数据运营的整个过程是怎么样的
对于企业的IT人员来说,最痛苦的事情莫过于面对业务的各种各样的需求,IT人员要在繁忙的开发任务中抽时间来做数据分析,而业务和领导则需要等很久才能拿到数据.重复的工作太多,一旦数据.需求都上涨,将承受更 ...
- 51Job大数据分析师岗位项目
51job中大数据分析师岗位情况分析(在Jupyter Notebook中处理) 第一步:载入库.搭建环境,载入并观察数据 In [] import pandas as pd import numpy ...
- 【Power BI+Excel+Python】2019年4月全国数据分析招聘岗位可视化分析
前言 近几年来,大数据.人工智能.云计算概念如火如荼,而数据分析作为大数据和人工智能领域必备的职能之一,在人才市场上需求越来越强劲. 那,数据分析职位,一般在哪些城市需求较多,各城市分布情况如何?需要 ...
最新文章
- Python操作Firefox
- linux系统读取第二个盘的数据,磁盘及文件系统管理—第二篇
- PowerShell-4.API调用以及DLL调用
- vue-自定义过滤器--时间
- java要频繁调用容器时_JAVA基础面试题
- caffe使用过程中遇到的问题和解决办法
- VMWare 修改虚拟机的swap文件
- 2021-2025年中国电子束加速器行业市场供需与战略研究报告
- 【FIRST USE】第一次用git把代码上传到github
- SSL P2711 正方形
- linux(ubuntu)下实现鼠标侧键映射双击、鼠标中键 快捷键的方法—— 使用xbindkeys
- 基于CST电磁仿真软件的7-10GHz的微带带通滤波器的设计
- linux设置cpu虚拟化,linux 查看cpu是否支持虚拟化
- Spring Gateway 报错java.lang.IllegalStateException: COMPLETED 解决
- 彻底解决[未识别的网络][公共网络]的问题
- Lucas-Kanade算法
- DxO FilmPack破解版|DxO FilmPack Elite 5.5.23破解版下载(附破解补丁)
- 如何在Word中的项目符号列表中自定义项目符号
- [地图]常用的地图结构
- (已解决)ERROR 2013 (HY000):连接MySql出错
热门文章
- 海图(基于http服务器的图片管理工具)
- matlab中希腊字母相除,matlab中希腊字母
- 经常有人在农村高价回收旧手机,啥样的都要,不赔钱吗?
- 终于找到工作了,太开心了
- 使用单个文件作数据库条目存储
- 开机logo bmp gif_比支付宝还蓝?腾讯 QQ 简洁版 TIM 更新 LOGO
- android draw过程,android,view的执行过程onDraw、onSizeChanged,onFinishInflate
- 一种基于RMON的网络探测器
- c语言分离短文中的英文单词,C语言 统计一篇英文短文中单词的个数
- idea的ctrl alt v 无效