基于python可视化的拉勾网招聘岗位分析

论文第一作者,原创,侵权必究

import requests
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import xlwt
def base(jos, page):urls='https://www.lagou.com/jobs/list_python?isSchoolJob=1'url='https://www.lagou.com/jobs/positionAjax.json?needAddtionalResult=false&isSchoolJob=1'headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.86 Safari/537.36','Referer': 'https://www.lagou.com/jobs/list_python?labelWords=sug&fromSearch=true&suginput=p','Accept': 'application/json, text/javascript, */*; q=0.01'}url_info(url,urls,headers,jos,page)returndef url_info(url,urls,headers,jos,page):info_list=[]for i in range(1,page+1):data = {'first': 'false','kd': jos,'pn': i}s=requests.session()s.get(urls,headers=headers,timeout=2)cookie=s.cookiesresult=s.post(url,data=data,headers=headers,cookies=cookie,timeout=4)info=result.json()info_list.append(info['content']['positionResult']['result'])Download(info_list,jos)def Download(infolist,jos):w=xlwt.Workbook(encoding='utf-8')ws=w.add_sheet(jos,cell_overwrite_ok=True)ws.write(0,0,'序号')ws.write(0,1,'公司')ws.write(0,2,'城市')ws.write(0,3,'职位')ws.write(0,4,'最低薪资(k)')ws.write(0,5,'最高薪资(k)')ws.write(0,6,'平均薪资(k)')ws.write(0,7,'学历要求')ws.write(0,8,'工作经验')ws.write(0,9,'职位优点')ws.write(0,10,'公司待遇')row=1for info in infolist:for n in range(0,len(info)):ws.write(row,0,row)ws.write(row,1,info[n]['companyFullName'])ws.write(row,2,info[n]['city'])ws.write(row,3,info[n]['positionName'])money = info[n]['salary'].split('-')money_min = int(money[0][:-1])money_max = int(money[1][:-1])money_ave = np.mean([money_min, money_max])ws.write(row,4,money_min )ws.write(row,5,money_max)ws.write(row,6,money_ave)ws.write(row,7,info[n]['education'])ws.write(row,8,info[n]['workYear'])ws.write(row,9,info[n]['positionAdvantage'])ws.write(row,10,info[n]['companyLabelList'])row+=1w.save('拉勾网.xls')print('爬取已完成')Readdata()return rowdef autolabel(rects):for rect in rects:height = rect.get_height()plt.text(rect.get_x()+rect.get_width()/2.-0.2, 1.03*height, '%s' % float(round(height,1)), fontsize=15)def Readdata():file = '拉勾网.xls'df = pd.read_excel(file)cs_ave_money= df.groupby(['城市'])['平均薪资(k)'].mean()cs_min_money=df.groupby(['城市'])['最低薪资(k)'].min()cs_max_money=df.groupby(['城市'])['最高薪资(k)'].max()cs_count=df.groupby(by=['城市']).size()plt.rcParams['font.sans-serif']=['SimHei']plt.rcParams.update({"font.size":20})data = list(cs_count.values)labels=list(cs_count.keys())plt.rcParams['figure.figsize'] = (15.0, 10.0)a = plt.bar(np.arange(0,len(labels)*2,2),cs_min_money,alpha=0.5,width=0.5,color='yellow',edgecolor='red',label='最低薪资',lw=3)b = plt.bar(np.arange(0,len(labels)*2,2)+0.5, cs_max_money, alpha=0.2, width=0.5, color='green', edgecolor='blue', label='最高薪资', lw=3)c = plt.bar(np.arange(0,len(labels)*2,2)+1, cs_ave_money, alpha=0.2, width=0.5, color='red', edgecolor='blue', label='平均薪资', lw=3)autolabel(a)autolabel(b)autolabel(c)plt.title('各地区薪资对照表',color='r')plt.ylabel('薪资(K)')plt.xlabel('城市')plt.legend()plt.xticks(np.arange(0,len(labels)*2,2)+0.5/2,labels)plt.show()plt.close()printplt.title('地区需求量分析',color='r')plt.pie(data,labels=labels,autopct='%1.1f%%',shadow=False,startangle=150)plt.show()plt.savefig('需求.png')plt.savefig('薪资.png')print('展示已完成')
if __name__ == '__main__':print("说明:此程序完成指定职位的各城市薪资对照表及需求量分析与展示 \n  注:页数越多数据分析越准确完善")position=input('请输入要查询的职位:')pg=input('请输入要爬取的页数<=30:')page=eval(pg)base(position,page)

相关链接:[论文发表:](http://d.wanfangdata.com.cn/periodical/ChlQZXJpb2RpY2FsQ0hJTmV3UzIwMjEwMzAyEhpRS0JKQkQyMDIwMjAyMTAzMTIwMDAwODAwNBoIaHY1d3E4MnY=)
# 

基于python可视化的拉勾网招聘岗位分析相关推荐

  1. Python爬虫实战之一 - 基于Requests爬取拉勾网招聘信息,并保存至本地csv文件

    Python爬虫实战之二 - 基于Requests抓取拉勾网招聘信息 ---------------readme--------------- 简介:本人产品汪一枚,Python自学数月,对于小白,本 ...

  2. 基于Python的微博大数据舆情分析,舆论情感分析可视化系统

    运行效果图 基于Python的微博大数据舆情分析,舆论情感分析可视化系统 系统介绍 微博舆情分析系统,项目后端分爬虫模块.数据分析模块.数据存储模块.业务逻辑模块组成. 先后进行了数据获取和筛选存储, ...

  3. 数据分析师招聘岗位分析

    数据分析师招聘岗位分析 1.本文的目的和内容 1.1.本文的目的: 通过分析能够了解公司对于数据分析岗位的要求及待遇 1.2本文的内容: 主要针对以下几个问题: 1.数据分析岗位不同城市的需求分布: ...

  4. 基于python可视化的网页搜索引擎设计#毕业设计

    开发环境 项目编号:基于python可视化的网页搜索引擎设计#毕业设计 开发语言:Python python框架:django 软件版本:python3.7/python3.8 数据库:mysql 5 ...

  5. 基于python的公众号课堂教学_基于Python的微信公众号数据挖掘分析

    基于Python的微信公众号数据挖掘分析 华南农业大学电子工程学院 王 建 黄宁香 [期刊名称]电子世界 [年(卷),期]2019(000)011 [总页数]3 运用Python网络爬虫技术对某时事类 ...

  6. python信用评分卡_基于Python的信用评分卡模型分析(二)

    上一篇文章基于Python的信用评分卡模型分析(一)已经介绍了信用评分卡模型的数据预处理.探索性数据分析.变量分箱和变量选择等.接下来我们将继续讨论信用评分卡的模型实现和分析,信用评分的方法和自动评分 ...

  7. 【人工智能毕设之基于Python+flask+bilstm的评论情感分析系统-哔哩哔哩】 https://b23.tv/QU56eTl

    [人工智能毕设之基于Python+flask+bilstm的评论情感分析系统-哔哩哔哩] https://b23.tv/QU56eTl https://b23.tv/QU56eTl

  8. python对于设计师有什么用-Python前程无忧深圳UI设计师岗位分析

    数据来源 爬虫抓取前程无忧1500多条深圳UI设计师岗位发布信息. 原始数据 image.png 处理后数据 image.png 说明: cate是企业给的福利,text是发布信息的文本,稍后提取. ...

  9. 基于python的数据爬取与分析_基于Python的网站数据爬取与分析的技术实现策略

    欧阳元东 摘要:Python为网页数据爬取和数据分析提供了很多工具包.基于Python的BeautifulSoup可以快速高效地爬取网站数据,Pandas工具能方便灵活地清洗分析数据,调用Python ...

  10. pycharm显示全部数据_【数据可视化】BI工程师岗位分析

    BI工程师岗位分析(参考网址:https://www.5xiaobo.com/?id=694) 一.数据爬取 1. 数据爬取我使用的软件是pycharm.(像jupyter notebook其实更方便 ...

最新文章

  1. 【C++】algorithm具体操作记录
  2. python爬虫项目-23个Python爬虫开源项目代码
  3. es scroll 时间_游标查询 Scroll | Elasticsearch: 权威指南 | Elastic
  4. 题目1023:EXCEL排序---------Case后面的是count,不是C
  5. php txtsql 说明,PHP学习笔记(2)txtSQL文档错误
  6. 获取分割后右边的字符串
  7. Maven学习笔记5:Maven属性、profile和资源过滤
  8. jquery和php上传文件进度条,jQuery实现文件上传进度条特效_jquery
  9. 索尼android 8,索尼宣布Android 8.0升级名单 Z系列被抛弃
  10. [转] oracle 数据库 SQL plus 连接方法
  11. 全局索引 前缀索引_面试系列 索引种类与优化
  12. Laravel 数据库配置
  13. JS内置对象方法——array
  14. 深度学习的代码实验结果复现问题
  15. 详解如何用爬虫工具批量采集阿里巴巴批发网商品数据
  16. 加密狗映射至虚拟服务器,ESXI 5.1/5.5 主机添加或映射USB设备(加密狗)(示例代码)...
  17. GMT、UTC、DST、CST时区代表的意义
  18. 批量cherry-pick
  19. IllegalStateException: Fragment already added
  20. PPT如何制作形状动画?

热门文章

  1. 如何限制文件服务器上传文件的速度,怎么设置上传软件文件速度限制
  2. 高压柜无线测温装置-无线无源温度传感器-安科瑞 顾月
  3. CSU 1725 加尔鲁什·地狱咆哮对阵虚灵大盗拉法姆
  4. [Mysql] MOD函数
  5. memcached源码分析-----item锁级别与item引用计数
  6. antd输入框禁止回车
  7. 桌面快捷方式小箭头去除与恢复方法
  8. 为什么外包公司这么不受欢迎 ?
  9. dll 不是 PML.NET callable问题解决办法
  10. 用Java创建一副扑克牌