公众号:中国统计网

01 报告背景
随着互联网大数据的日益火热,各大企业对于数据的需求逐日增加。大数据浪潮的袭来,带来了数据分析师岗位的就业。基于此,对前程无忧关于数据分析师岗位招聘的数据进行系统的分析。
02 分析目的
本分析报告解决以下三个问题:
1. 数据分析师岗位在哪些城市需求量较大?
2. 数据分析师岗位的薪资待遇情况是如何?
3. 数据分析师岗位薪资待遇的发展趋势如何?
03 分析报告
1. 准备数据源
利用爬虫工具对前程无忧进行数据分析岗搜索结果进行爬虫,提取分析字段:职位名称、公司名称、工作城市、薪资待遇、学历要求、工作经验以及公司规模。
2. 数据清洗
2.1. 清洗学历要求字段
因前程无忧学历项不是必填项,在爬虫过程中会抓取错误数据,需要清洗掉。结果如下。
处理过程:将包含“招”的单元格直接替换为“无要求”
2.2. 清洗工作城市
将类似于“广州-天河区”调整为“广州”,便于后期统计城市数据。
处理过程:利用数据分列直接调整。
2.3. 删除数据重复项
职位ID是唯一识别码,所以对职位ID进行排重。
处理过程:利用删除重复项功能进行删除。
2.4. 清洗薪资待遇
  • 将日薪直接删除,日薪234个数据均为同一家公司发布的招聘信息,对整体数据会存在一定的干扰性。

  • 将年薪直接删除,年薪234个数据均为同一家公司发布的招聘信息,对整体数据会存在一定的干扰性。

  • 将月薪的区间范围调整为最低值和最高值。

处理过程:
最低薪资:利用FIND函数求得“-”从左开始第几位,然后利用LEFT函数从左开始取值,取值范围比“-”位数少1即可;加入IF函数和ISNUMBER函数,判定如果薪资待遇包含“万”,那么计算需要乘以10。
最高薪资:利用LEN函数求得单元格字符总长度,再减去利用FIND函数求得“-”的位数,即可求得“-”以后的字符总长度。利用MID函数取值“-”以后的字符再减去3(3即为千/月)。加入IF函数和ISNUMBER函数,判定如果薪资待遇包含“万”,那么计算需要乘以10。
平均薪资:利用AVERAGE函数直接求平均值。
删除【薪资待遇】列
2.5. 清洗异常值
将不包含“数据分析”、“数据运营”和“分析师”等字符的职位删除掉。
处理过程:利用FIND函数查找特殊字符并返回结果值,利用COUNT函数计数,利用IF函数判定,如果计数成功则为“是”,表示符合数据分析师岗位;如果计数失败则为“否”,表示不符合,可以删除。
剩余2293条数据。
3. 数据结果可视化
3.1. 数据分析师岗位在哪些城市需求量较大?
  • 依据柱形图所示,数据分析师岗位在上海、广州、深圳和北京需求是偏多的。

  • 依据饼形图所示,数据分析师在上海、广州、深圳和北京的需求量接近总数的67%。

小结,如果从事数据分析师岗位,在北上广深可以提升成功的概率。
3.2. 数据分析师岗位的薪资待遇情况是如何?
依据柱形图所示,数据分析师岗位大部分集中在1-3年和3-5年,属于年轻化和朝阳化的行业。5-10年的岗位急剧下降,也就是意味着如果5年后没有能力的提升,那么你的就业竞争就会很大。
依据柱形图所示,数据分析师薪资待遇深圳和北京最高,其次是上海和杭州。追求高薪可以去这些城市发展。
3.3. 数据分析师岗位薪资待遇的发展趋势如何?
依据折线图所示,随着工作年限的逐步增加,薪资待遇也会逐步增加。

报告总结

1)从就业需求来讲,大量的工作机会集中在北上广深和新一线城市。如果想从事数据分析工 作,去这些城市将提升你成功的条件概率。

2)从薪资待遇上看,数据分析师留在深圳发展是个不错的选择,其次是北京、上海。

3)数据分析是个年轻的职业方向,大量的工作经验需求集中在1-3年和3-5年。对于数据分析师来说,5年的就业岗位数量急剧下降,如果在5年之内没有提升自己的能力,以后的竞争压力会比较大。

4)随着经验的提升,数据分析师的薪酬也在不断提高,10年以上工作经验的人,能获得相当丰厚的薪酬。

注:因特殊原因,数据图表均未标识数据来源以及爬虫工具名称,请忽略此点。
请扫码关注:

爬取6874条数据,告诉你数据分析师的薪资待遇~!相关推荐

  1. Python爬取44130条用户观影数据,分析挖掘用户与电影之间的隐藏信息!

    1.前言 本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理. PS:如有需要Python学习资料的小伙伴可以点击下方链接自行获取 Python免费学习 ...

  2. 爬取 4400 条淘宝洗发水数据,拯救你的发际线!(附代码和数据集)

    本文通过淘宝"防脱发洗发水"爬取和分析,来提供爬取海量淘宝商品信息的思路,除了基础爬虫外,还应该思考拿到类似的商品数据之后如何清洗,以及作为一个分析者可以从什么维度去分析. 作者 ...

  3. Python爬取上万条大众点评数据,解读一线快餐品牌背后的秘密

    中国的快餐市场竞争一直都很激烈,关于各种品牌江湖上也流传着各种神奇的故事,那么你知道 一线城市最多的快餐品牌是哪家? 沙县小吃真的是中国餐饮巨头吗? 每一家肯德基边上都有一家麦当劳是不是真的? 星巴克 ...

  4. 实战▍Python爬取3w条游戏评分数据,看看哪款最热门?

    图| 战争前线游戏原画   本文作者| 量化小白H 本文为投稿,36大数据已获发布授权 36大数据推荐 实战项目 本文爬取了豆瓣游戏网站上所有可见的游戏评分数据进行分析,全文包括以下几个部分: 数据获 ...

  5. Python 爬取 201865 条《隐秘的角落》弹幕数据,发现看剧不如爬山?

    Python 爬取 201865 条<隐秘的角落>弹幕数据,发现看剧不如爬山? 本文不涉及剧透!请放心食用 最近又火了一步国产剧:<隐秘的角落> 如果你没看过,那可能会对朋友圈 ...

  6. 爬取3w条『各种品牌』笔记本电脑数据,统计分析并进行可视化展示!真好看~...

    本文代码讲解已录成视频,欢迎扫码学习! 本文手撕代码过程 01 前言 在上一篇文章[教你用python爬取『京东』商品数据,原来这么简单!]教大家如何学会爬取『京东』商城商品数据. 今天教大家如何爬取 ...

  7. python爬取9000条京东内衣销售数据,最最最最基础的语言和语法;并利用这些数据,基于Aprior算法分析“是否罩杯大的人倾向于买贵一些的bra”

    47[TOC](爬取9000条京东内衣销售数据,最最最最基础的语言和语法,并利用这些数据,基于Aprior算法分析"是否罩杯大的人倾向于买贵一些的bra") 本人刚接触python ...

  8. 用 Python 爬取 4332 条数据,揭秘甜咸肉粽的江湖!

    作者 | 朱小五 责编 | 屠敏 来源 | 凹凸数据 端午节快要到了,甜咸粽子之争也快要拉开帷幕. 本文准备用Python爬取淘宝上的粽子数据并进行分析,看看有什么发现. 注:本文仅用于学习交流,禁止 ...

  9. python爬虫课设-爬取3000条数据并做数据可视化

    很久以前接的单子,分享一下(挺水的,将就着看吧) 文章目录 作业要求 数据爬取 爬取结果 数据处理 数据可视化 大作业文档 作业要求 <Python与数据分析>期末大作业要求(2020-2 ...

最新文章

  1. 一文读懂对抗机器学习Universal adversarial perturbations | CSDN博文精选
  2. zabbix监控nginx,PHP-FPM,ELK报警
  3. [转]制作BlogWriter 博客客户端
  4. 那些喜欢诉苦的人,他们大概会一直苦下去
  5. 怎样才算精通Python?
  6. python去重计数_用Python实现透视表的value_sum和countdistinct功能
  7. C++的multi_map如何输出所有key值相等的元素
  8. Maven SCM Release版本控制与发布
  9. 全网独家【超越VOSviewer】突破VOSviewer只能做数据库里数据的限制
  10. 夏普红外测距模块使用笔记
  11. typecho插件,typechoSEO插件,typecho程序插件
  12. [ERROR] InnoDB: Write to file (merge)failed at offset 4249878528, 1048576 bytes should have been wri
  13. solidity学习-投票
  14. 银行卡收单____对账__单边账
  15. php unlink权限设置,php中删除文件用unlink函数权限判断
  16. stc8a-22.1184-bu 步。。。。进。、电。额。机
  17. c语言中的头文件stdlib.h的作用,c语言includestdlib.h什么意思?
  18. [从头读历史] 第312节 星球战争 BC2199 至 BC2100(公元前22世纪)
  19. c语言 读取文件数据 换行符,c++如何读取文件中的换行符
  20. 单片机方波da转换c语言程序,基于51单片机的波形发生器DA转换(dac0832)

热门文章

  1. 使用bootstrap框架快速开发网页
  2. 2014Android Demo源码 文件夹 PATH 列表
  3. CE自动汇编之AOB注入
  4. 跨境电商独立站怎么去搭建
  5. VB:编一个子过程DeleStr(s1,s2),将字符串s1中出现的s2子字符串删去,结果存放在s1中
  6. 彗星mysql_为什么彗星被认为是一个“脏雪球”?
  7. python 怎么输出实际的根号2_Python怎么输出根式?
  8. PyQt5 密码输入框
  9. smartcar.urdf.xacro
  10. Unity UI跟随鼠标移动