原创 xinxin 菜鸟学Python

阅读本文大概需要3分钟
Python学了这么久,相信很多小伙伴都想知道钱途如何,全国各大城市招聘Python的岗位有多少,都招哪些职位,年薪如何等等,我爬取了拉勾近1600个Python相关的职位,我们用数据说话!
原始的数据长啥样下面我们先来看一下拉勾网上原始网站数据是有哪些维度:
公司名子,岗位名称,地域,年薪薪资幅度和发布时间

我们用Python爬取之后得到的数据长这样,我们把薪资做了一丢丢的处理分成最高年薪和最低年薪

一共1552个岗位:

开始数据清洗可能大家都认为数据分析,是不是分析部分最耗时!其实数据分析里面有70%的工作都是做数据清洗,需要把杂乱无章的数据按照一定的业务逻辑归正,清洗,清洗的好坏对后面的数据分析非常有帮助!这个好像做饭类似(洗菜,切菜很重要)1.对薪资进行处理
薪资里面有大写的K,也有小写的k,我们需要去掉杂乱的字符并过滤掉Kk,为了方便后面的分析和统计。

2.增加岗位种类,岗位级别,平均年薪
我们发现数据集里面的岗位描述非常乱,混杂了级别和种类,比如:职位类别:
Python的工种:爬虫,web,数据分析/数据挖掘/数据开发,机器学习,讲师,运维,云计算,后端,自动化,全栈然后默认是开发职位等级:分实习,毕业生,普通,高级的,资深,架构,经理,总监平均年薪:原始的年薪是一个幅度,不便统计,我们增加一列平均年薪的数据
我们经过数据转换,重新归正之后的数据:

数据初探经过前面几步的处理,数据已经整齐很多, 下面我们就可以开始分析一下数据:1.Python职位地域统计:

果然Python在北上广深需求非常大,尤其是北京.2.大城市的平均年薪和最高年薪:

3.看到数据集里面有Python年薪50万的,都是哪些土豪公司

发现最高年薪几乎都在北京,而且都是在新美大这些大公司里面.
Python岗位数据可视化1.招聘人数排名:

发现几乎都是知名的互联网公司都在招Python的人才,有饿了么,小米,瓜子,UCloud,360,腾讯,阿里巴巴,陌陌,美团,知乎等等!而需求最大的是Veeva公司,大量的在招人,有需求的同学可以关注2.Python 需求的岗位比例:

普通 1195 高级 218 实习 58 资深 30 中级 17 经理 12 初级 10 架构 8 总监 43.Python年薪最高的均值在15万以上:

发现除了北上广深,好像广州不给力啊只有15w,其中杭州和合肥非常不错!结合当地的房价看,性价比高呀,都有20w左右.4.Python10大职位的薪资:

发现所有的Python岗位里面全栈竟然是最高的,其次是讲师。看来学Python的往全栈发展也是一个非常不错的选择。

python爬取岗位数据并分析_Python年薪最高有50w|探秘全国近1600个Python岗位数据分析...相关推荐

  1. python爬取微博数据存入数据库_Python爬取微博数据并存入mysql,excel中

    寒假期间做微博数据统计,由于是部门要求,也没办法,自己又是一个懒人,直接用python实现吧.写的很粗糙,也很差,请大家别介意. 总的来说分成两个模块:一个爬取微博数据存入数据库,一个从数据库调取数据 ...

  2. python爬取微博数据存入数据库_Python爬取新浪微博评论数据,写入csv文件中

    因为新浪微博网页版爬虫比较困难,故采取用手机网页端爬取的方式 操作步骤如下: 1. 网页版登陆新浪微博 2.打开m.weibo.cn 3.查找自己感兴趣的话题,获取对应的数据接口链接 4.获取cook ...

  3. python爬取b站弹幕分析_python爬取B站视频弹幕分析并制作词云

    目录1.分析网页 2.爬虫+jieba分词+制作词云2.1爬虫 2.2jieba分词 2.3制作词云 3.成品展示 4.完整代码 1.分析网页 视频地址:https://www.bilibili.co ...

  4. python爬取豆瓣电影并分析_Python爬取豆瓣电影的短评数据并进行词云分析处理

    前言 对于爬虫很不陌生,而爬虫最为经典的案例就是爬取豆瓣上面的电影数据了,今天小编就介绍一下如果爬取豆瓣上面电影影评,以<我不是药神>为例. 基本环境配置 版本:Python3.6 相关模 ...

  5. python爬取豆瓣电影并分析_Python实战之如何爬取豆瓣电影?本文教你

    爬虫又称为网页蜘蛛,是一种程序或脚本. 但重点在于,它能够按照一定的规则,自动获取网页信息. 爬虫的基本原理--通用框架 1.挑选种子URL: 2.讲这些URL放入带抓取的URL列队: 3.取出带抓取 ...

  6. python爬取微博数据存入数据库_python爬取微博并且存入数据库

    由于平时喜欢刷微博,追星,所以写了想要写一个爬取微博的爬虫,在老师的建议下选择从移动端爬取,因为移动端页面元素简洁,易于爬取.在看微博时发现有比移动端更加简单的一个版本....老年机版?就是分页式的. ...

  7. Python爬取双色球数据进行分析

    突发奇想,是否可以从双色球的历史信息中分析出现次数最多的组合,那就从1+1的组合开始分析,嘿嘿,经常中这种组合也挺不错哦!现在我们开始获取数据,应该从中彩网的爬取数据比较靠谱,下面是脚本. # -*- ...

  8. python爬取b站弹幕分析_Python 爬取「后浪」弹幕,看看大家都在说什么

    前天,正好是五四青年节, B 站的一条献给年轻人的视频「后浪」火了,一时间到处都是各种讨论「后浪」的声音. 其他的平台先不管,先看看 B 站平台本身用户对「后浪」的评价. B 站的评论是弹幕的形式,想 ...

  9. 用Python爬取上市公司数据、分析数据

    前言 在很多网站上,都会以表格的形式展示数据,而我们获取这种数据只需通过十几行爬虫代码就可以搞定,轻松搞定网页爬虫,实现高效办公 知识点: 爬虫基本原理 requests的简单使用 pandas库 p ...

最新文章

  1. HDU 1848 Fibonacci again and again(博弈)
  2. a股历史30年的大盘价_[最新]回顾A股历史上的大井喷行情
  3. 【Scratch】青少年蓝桥杯_每日一题_4.01_踢足球
  4. python max函数_使用'key'和lambda表达式的python max函数
  5. 如何替公司省下数千万勒索费用
  6. Spring Boot中的测试
  7. html5进度条插件 传递参数,Html5进度条插件(自写)
  8. vrp 节约算法 c++_滴滴技术:浅谈滴滴派单算法
  9. docker搭建mysql主从
  10. 从零玩转Webpack4~5+实现原理笔记(二)
  11. ceph_OSD的添加删除
  12. 【优化算法】多目标跟踪优化算法(MTOA)【含Matlab源码 1466期】
  13. 实分析royden第四版答案_实分析(原书第4版)_[美]H.L.罗伊登(H.L.Royden) P.M.菲茨帕特里克(P.M.Fitzpatrick)_9787111630845_...
  14. HHL算法第四弹(回顾伴随、正定算子、半正定算子、正规算子、酉矩阵、幺正矩阵、厄米矩阵,极式分解,奇异值分解)
  15. php服务器怎么设置cookie,PHP之COOKIE支持详解
  16. linux单引号作用,linux中单引号、双引号、反引号的作用
  17. perl novel可变剪接识别(2)
  18. UnityEngine.Quaternion.LookRotation的使用(感觉这个用着还不错做一个笔记)
  19. 骨干是折腾出来的 读书笔记10
  20. 通信业的双11来了!充话费、办宽带、买手机每年这时候最划算

热门文章

  1. 计算两个String 类型的时间相关几个月
  2. MQ学习(一)----JMS规范(转发整合)
  3. Objective-C 2.0的运行时编程-消息转发
  4. Android对话框的高级设置《一》设置对话框按钮的图像和在内容文本中插入图像
  5. 基于kl变换的人脸识别_简述几种人脸识别的主要方法
  6. R count函数_【函数分享】PHP函数str_word_count()分享(202098)
  7. FFmpeg之获取音视频信息(二十八)
  8. AudioUnitRender -10876
  9. SpringBoot之注解
  10. 树莓派之启用root密码