python爬取智联招聘网_python爬取智联招聘工作岗位信息

1 # coding:utf-8

2 # auth:xiaomozi

3 #date:2018.4.19

4 #爬取智联招聘职位信息

7 import urllib

8 from lxml import etree

9 import time

10 import random

11 import pdb

13 def downloader(kw,pages):

14 '''下载器

15 :param kw: 搜索关键字

16 :param pages: 搜索的页码，数组

17 :return: 返回爬取到的HTML集合

18 '''

19 for page in pages:

20 print("the {}page is downloading".format(page))

21 infourl = 'https://sou.zhaopin.com/jobs/searchresult.ashx?jl=%E6%B7%B1%E5%9C%B3&kw={}&sm=0&p={}'.format(kw, str(page))

22 time.sleep(random.uniform(0.5, 2.1))

23 info = urllib.urlopen(infourl).read()

24 yield info

26 def extractor(html):

27 '''

28 提取工作岗位信息，返回一个yield

29 :param html: html字符串

30 :return: 生成器

31 '''

32 et=etree.HTML(html)

33 tablerows = et.xpath('//div[@class="newlist_list_content"]/table[@class="newlist"]/tr[1]')

34 item = {}

35 for tr in tablerows:

36 tr = etree.HTML(etree.tostring(tr))

37 item['job'] = tr.xpath('//td[@class="zwmc"]//a[1]/text()')

38 item['com_name'] = tr.xpath('//td[@class="gsmc"]/a[1]/text()')

39 item['salary'] = tr.xpath('//td[@class="zwyx"]/text()')

40 item['address'] = tr.xpath('//td[@class="gzdd"]/text()')

41 yield item

43 def saveInfo(items):

44 '''

45 保存到本地或打印到控制台

46 :param items: 工资岗位信息，类型为生成器

47 :return: 返回处理结果状态

48 '''

49 for i in items:

50 print(i)

51 return('finished')

53 #调用

54 infohtmls= downloader(kw='GIS',pages=range(1,5))

55 for html in infohtmls:

56 myitems=extractor(html)

57 saveInfo(myitems)

执行结果截图如下：爬取到了满满的3页哦。

如您对本文有疑问或者有任何想说的，请点击进行留言回复，万千网友为您解惑！

python爬取智联招聘网_python爬取智联招聘工作岗位信息相关推荐

python爬去智联招聘网_Python爬虫爬取智联招聘（进阶版）
点击上方"程序人生",选择"置顶公众号" 第一时间关注程序猿(媛)身边的故事图片:Westworld Season 2 作者王强简介 Python追随者, ...
python抓取招聘数据_Python爬取招聘网站数据并做数据可视化处理
本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理. 以下文章来源于青灯编程 ,作者:清风前言本文的文字及图片来源于网络,仅供学习.交流使用,不具有 ...
python爬取淘宝商品信息_python爬取淘宝商品信息并加入购物车
先说一下最终要达到的效果:谷歌浏览器登陆淘宝后,运行python项目,将任意任意淘宝商品的链接传入,并手动选择商品属性,输出其价格与剩余库存,然后选择购买数,自动加入购物车. 在开始爬取淘宝链接之前, ...
python可以爬取的内容有什么_Python爬取视频(其实是一篇福利)过程解析 Python爬虫可以爬取什么...
如何用python爬取视频网站的数据如何用python爬取js渲染加载的视频文件不是每个人都有资格说喜欢,也不是每个人都能选择伴你一生! 有哪位大神指导下,有些视频网站上的视频文件是通过 js 加载 ...
Python爬虫实战三 | 蓝奏网盘抓取网盘链接信息
今天在使用蓝奏网盘的时候发现有一个文件夹加密分享,然后我就尝试了加密文件夹,但是文件夹下的文件还是可以直接通过访问该文件链接得到,所以对于文件夹加密是否显得有点鸡肋了呐? 如此,我们便简单的使用Pyt ...
python爬取千图网_python爬取lol官网英雄图片代码
python爬取lol官网英雄图片代码可以帮助用户对英雄联盟官网平台的皮肤图片进行抓取,有很多喜欢lol的玩家们想要官方的英雄图片当作自己的背景或者头像,可以使用这款软件为你爬取图片资源,操作很简单, ...
python爬取招聘信息_python 爬取boss直聘招聘信息实现
原标题:python 爬取boss直聘招聘信息实现 1.一些公共方法的准备获取数据库链接: importpymysql ''' 遇到不懂的问题?Python学习交流群:821460695满足你的需求 ...
python爬取boss直聘招聘信息_Python 爬取boss直聘招聘信息！
原标题:Python 爬取boss直聘招聘信息! 1.一些公共方法的准备获取数据库链接: importpymysql ''' 遇到不懂的问题?Python学习交流群:821460695满足你的需求, ...
[python爬虫]selenium模拟登录京东招聘网，爬取研发类，数据清洗，数据存储，终数据分析和可视化
目录引入包模拟登陆京东网利用XPath对网页源代码进行解析数据清洗每页数据以追加形式保存至csv文件保存数据到MongoDB数据库,参数为字典组成的列表数据分析与可视化总函数引入包 ...

python爬取智联招聘网_python爬取智联招聘工作岗位信息

python爬取智联招聘网_python爬取智联招聘工作岗位信息相关推荐

最新文章

热门文章