基于python可视化的拉勾网招聘岗位分析

论文第一作者，原创，侵权必究

import requests
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import xlwt
def base(jos, page):urls='https://www.lagou.com/jobs/list_python?isSchoolJob=1'url='https://www.lagou.com/jobs/positionAjax.json?needAddtionalResult=false&isSchoolJob=1'headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.86 Safari/537.36','Referer': 'https://www.lagou.com/jobs/list_python?labelWords=sug&fromSearch=true&suginput=p','Accept': 'application/json, text/javascript, */*; q=0.01'}url_info(url,urls,headers,jos,page)returndef url_info(url,urls,headers,jos,page):info_list=[]for i in range(1,page+1):data = {'first': 'false','kd': jos,'pn': i}s=requests.session()s.get(urls,headers=headers,timeout=2)cookie=s.cookiesresult=s.post(url,data=data,headers=headers,cookies=cookie,timeout=4)info=result.json()info_list.append(info['content']['positionResult']['result'])Download(info_list,jos)def Download(infolist,jos):w=xlwt.Workbook(encoding='utf-8')ws=w.add_sheet(jos,cell_overwrite_ok=True)ws.write(0,0,'序号')ws.write(0,1,'公司')ws.write(0,2,'城市')ws.write(0,3,'职位')ws.write(0,4,'最低薪资(k)')ws.write(0,5,'最高薪资(k)')ws.write(0,6,'平均薪资(k)')ws.write(0,7,'学历要求')ws.write(0,8,'工作经验')ws.write(0,9,'职位优点')ws.write(0,10,'公司待遇')row=1for info in infolist:for n in range(0,len(info)):ws.write(row,0,row)ws.write(row,1,info[n]['companyFullName'])ws.write(row,2,info[n]['city'])ws.write(row,3,info[n]['positionName'])money = info[n]['salary'].split('-')money_min = int(money[0][:-1])money_max = int(money[1][:-1])money_ave = np.mean([money_min, money_max])ws.write(row,4,money_min )ws.write(row,5,money_max)ws.write(row,6,money_ave)ws.write(row,7,info[n]['education'])ws.write(row,8,info[n]['workYear'])ws.write(row,9,info[n]['positionAdvantage'])ws.write(row,10,info[n]['companyLabelList'])row+=1w.save('拉勾网.xls')print('爬取已完成')Readdata()return rowdef autolabel(rects):for rect in rects:height = rect.get_height()plt.text(rect.get_x()+rect.get_width()/2.-0.2, 1.03*height, '%s' % float(round(height,1)), fontsize=15)def Readdata():file = '拉勾网.xls'df = pd.read_excel(file)cs_ave_money= df.groupby(['城市'])['平均薪资(k)'].mean()cs_min_money=df.groupby(['城市'])['最低薪资(k)'].min()cs_max_money=df.groupby(['城市'])['最高薪资(k)'].max()cs_count=df.groupby(by=['城市']).size()plt.rcParams['font.sans-serif']=['SimHei']plt.rcParams.update({"font.size":20})data = list(cs_count.values)labels=list(cs_count.keys())plt.rcParams['figure.figsize'] = (15.0, 10.0)a = plt.bar(np.arange(0,len(labels)*2,2),cs_min_money,alpha=0.5,width=0.5,color='yellow',edgecolor='red',label='最低薪资',lw=3)b = plt.bar(np.arange(0,len(labels)*2,2)+0.5, cs_max_money, alpha=0.2, width=0.5, color='green', edgecolor='blue', label='最高薪资', lw=3)c = plt.bar(np.arange(0,len(labels)*2,2)+1, cs_ave_money, alpha=0.2, width=0.5, color='red', edgecolor='blue', label='平均薪资', lw=3)autolabel(a)autolabel(b)autolabel(c)plt.title('各地区薪资对照表',color='r')plt.ylabel('薪资(K)')plt.xlabel('城市')plt.legend()plt.xticks(np.arange(0,len(labels)*2,2)+0.5/2,labels)plt.show()plt.close()printplt.title('地区需求量分析',color='r')plt.pie(data,labels=labels,autopct='%1.1f%%',shadow=False,startangle=150)plt.show()plt.savefig('需求.png')plt.savefig('薪资.png')print('展示已完成')
if __name__ == '__main__':print("说明：此程序完成指定职位的各城市薪资对照表及需求量分析与展示 \n  注：页数越多数据分析越准确完善")position=input('请输入要查询的职位:')pg=input('请输入要爬取的页数<=30:')page=eval(pg)base(position,page)


相关链接：[论文发表：](http://d.wanfangdata.com.cn/periodical/ChlQZXJpb2RpY2FsQ0hJTmV3UzIwMjEwMzAyEhpRS0JKQkQyMDIwMjAyMTAzMTIwMDAwODAwNBoIaHY1d3E4MnY=)
#

基于python可视化的拉勾网招聘岗位分析相关推荐

Python爬虫实战之一 - 基于Requests爬取拉勾网招聘信息，并保存至本地csv文件
Python爬虫实战之二 - 基于Requests抓取拉勾网招聘信息 ---------------readme--------------- 简介:本人产品汪一枚,Python自学数月,对于小白,本 ...
基于Python的微博大数据舆情分析，舆论情感分析可视化系统
运行效果图基于Python的微博大数据舆情分析,舆论情感分析可视化系统系统介绍微博舆情分析系统,项目后端分爬虫模块.数据分析模块.数据存储模块.业务逻辑模块组成. 先后进行了数据获取和筛选存储, ...
数据分析师招聘岗位分析
数据分析师招聘岗位分析 1.本文的目的和内容 1.1.本文的目的: 通过分析能够了解公司对于数据分析岗位的要求及待遇 1.2本文的内容: 主要针对以下几个问题: 1.数据分析岗位不同城市的需求分布: ...
基于python可视化的网页搜索引擎设计#毕业设计
开发环境项目编号:基于python可视化的网页搜索引擎设计#毕业设计开发语言:Python python框架:django 软件版本:python3.7/python3.8 数据库:mysql 5 ...
基于python的公众号课堂教学_基于Python的微信公众号数据挖掘分析
基于Python的微信公众号数据挖掘分析华南农业大学电子工程学院王建黄宁香 [期刊名称]电子世界 [年(卷),期]2019(000)011 [总页数]3 运用Python网络爬虫技术对某时事类 ...
python信用评分卡_基于Python的信用评分卡模型分析（二）
上一篇文章基于Python的信用评分卡模型分析(一)已经介绍了信用评分卡模型的数据预处理.探索性数据分析.变量分箱和变量选择等.接下来我们将继续讨论信用评分卡的模型实现和分析,信用评分的方法和自动评分 ...
【人工智能毕设之基于Python+flask+bilstm的评论情感分析系统-哔哩哔哩】 https://b23.tv/QU56eTl
[人工智能毕设之基于Python+flask+bilstm的评论情感分析系统-哔哩哔哩] https://b23.tv/QU56eTl https://b23.tv/QU56eTl
python对于设计师有什么用-Python前程无忧深圳UI设计师岗位分析
数据来源爬虫抓取前程无忧1500多条深圳UI设计师岗位发布信息. 原始数据 image.png 处理后数据 image.png 说明: cate是企业给的福利,text是发布信息的文本,稍后提取. ...
基于python的数据爬取与分析_基于Python的网站数据爬取与分析的技术实现策略
欧阳元东摘要:Python为网页数据爬取和数据分析提供了很多工具包.基于Python的BeautifulSoup可以快速高效地爬取网站数据,Pandas工具能方便灵活地清洗分析数据,调用Python ...
pycharm显示全部数据_【数据可视化】BI工程师岗位分析
BI工程师岗位分析(参考网址:https://www.5xiaobo.com/?id=694) 一.数据爬取 1. 数据爬取我使用的软件是pycharm.(像jupyter notebook其实更方便 ...

基于python可视化的拉勾网招聘岗位分析

基于python可视化的拉勾网招聘岗位分析

基于python可视化的拉勾网招聘岗位分析相关推荐

最新文章

热门文章