import scrapy
import jsonclass TzcSpider(scrapy.Spider):# spider的名字,唯一name = 'tzc'# 起始地址start_urls = ['https://hr.tencent.com/position.php?keywords=python&tid=0&lid=2268']# 每个url爬取之后会调用这个方法def parse(self, response):tr = response.xpath( '//table[@class="tablelist"]/tr[@class = "even"]|//table[@class="tablelist"]/tr[@class = "odd"]')with open('info.json','a') as f:for i in tr:data = {"jobName": i.xpath('./td[1]/a/text()').extract_first(),"jobType":i.xpath('./td[2]/text()').extract_first(),"Num":i.xpath('./td[3]/text()').extract_first(),"Place":i.xpath('./td[4]/text()').extract_first(),"Time":i.xpath('./td[5]/text()').extract_first()}data = json.dumps(data,ensure_ascii=False)f.write(data)f.write('\n')# 寻找下一页标签url_next = response.xpath('//a[@id = "next"]/@href').extract_first()# 提取的是段标签,需要加上域名url_next = 'https://hr.tencent.com/{}'.format(url_next)# 返回下一页地址,scrapy会递归return scrapy.Request(url_next)

转载于:https://www.cnblogs.com/cxhzy/p/10299696.html

scrapy 第一个案例(爬取腾讯招聘职位信息)相关推荐

  1. python爬取2019年计算机就业_2019年最新Python爬取腾讯招聘网信息代码解析

    原标题:2019年最新Python爬取腾讯招聘网信息代码解析 前言 初学Python的小伙们在入门的时候感觉这门语言有很大的难度,但是他的用处是非常广泛的,在这里将通过实例代码讲解如何通过Python ...

  2. 【Python爬虫案例学习20】Python爬虫爬取智联招聘职位信息

    目的:输入要爬取的职位名称,五个意向城市,爬取智联招聘上的该信息,并打印进表格中 ####基本环境配置: Python版本:2.7 开发工具:pycharm 系统:win10 ####相关模块: im ...

  3. 腾讯python招聘_2019年最新Python爬取腾讯招聘网信息代码解析

    前言 初学Python的小伙们在入门的时候感觉这门语言有很大的难度,但是他的用处是非常广泛的,在这里将通过实例代码讲解如何通过Python语言实现对于腾讯招聘网站信息的抓取废话不多说,各位小伙伴们一起 ...

  4. Python爬虫爬取智联招聘职位信息

    目的:输入要爬取的职位名称,五个意向城市,爬取智联招聘上的该信息,并打印进表格中 #coding:utf-8 import urllib2 import re import xlwtclass ZLZ ...

  5. Scrapy框架学习笔记 - 爬取腾讯招聘网数据

    文章目录 一.Scrapy框架概述 (一)网络爬虫 (二)Scrapy框架 (三)安装Scrapy框架 (四)Scrapy核心组件 (五)Scrapy工作流程 二. Scrapy案例演示 (一)爬取目 ...

  6. python爬取智联招聘职位信息(单进程)

    我们先通过百度搜索智联招聘,进入智联招聘官网,一看,傻眼了,需要登录才能查看招聘信息 没办法,用账号登录进去,登录后的网页如下: 输入职位名称点击搜索,显示如下网页: 把这个URL:https://s ...

  7. java爬取智联招聘职位信息

    第一次写爬虫,案例比较简单,就在智联招聘网站上爬取职位信息. 技术点:IO流,集合,Jsoup使用,以及前端的知识 代码如下: package com.wty.utils;import java.io ...

  8. Python爬取智联招聘职位信息

    这是一次失败的尝试 , 事情是这样的-- 1.起因 前段时间刚刚学完爬虫,于是准备找个项目练练手.因为想要了解一下"数据挖掘"的职位招聘现状,所以我打算对'智联招聘'下手了.网上当 ...

  9. 爬虫练习二:爬取智联招聘职位信息

    1. 简介 因为想要找到一个数据分析的工作,能够了解到市面上现有的职位招聘信息也会对找工作有所帮助. 今天就来爬取一下智联招聘上数据分析师的招聘信息,并存入本地的MySQL. 2. 页面分析 2.1 ...

最新文章

  1. 云平台已经成为发生网络攻击的重灾区
  2. Qt Quick 中 QML 与 C++ 混合编程详解
  3. 【VB.NET】测验题目Quiz3
  4. python list 实现原理,Python 列表(List)的底层实现原理分析
  5. python for循环练习
  6. 维护删除订单后,清空安装和售后信息;条码打印软件补充打印问题
  7. SpringBoot 一个依赖搞定 session 共享,没有比这更简单的方案了!
  8. java二叉树递归算法_Java二叉树的四种遍历(递归和非递归)
  9. 从零搭建 ES 搜索服务(五)搜索结果高亮
  10. 我的读书笔记 -《鬼谷子》
  11. 像《王者荣耀》一样红过
  12. EDA实验(3)计数器设计
  13. CTGU实验6_2-创建函数计算图书超期天数
  14. 来自首次Ray聚会的记录
  15. 关于api-ms-win-crt-runtimel1-1-0.dll缺失引发的解决方案
  16. Typora自动上传图床配置
  17. 为你解析--音视频会议系统
  18. 【转】do{...}while(0)的意义和用法
  19. 《论文笔记》Autonomous Robotic Exploration Based on Multiple Rapidly-exploring
  20. ERP源码 制造业通用ERP源码 生产ERP源码

热门文章

  1. 蓝桥杯之第几个幸运数
  2. rest服务器性能,使用多线程提高REST服务性能
  3. 大一高数下册笔记整理_初中化学期中重难点解读,复习不用愁啦,建议抄笔记...
  4. php apache 配置文件,Linux下apache支持PHP配置文件的方法
  5. 图论--欧拉回路--弗罗莱算法模板
  6. springboot quartz动态任务处理
  7. 这可能是关于Pytorch底层算子扩展最详细的总结了!
  8. linux-shell命令之cp(copy)【拷贝复制】
  9. [二叉树]序列化二叉树 (剑指offer61)
  10. 如何选择和计算滤波电容?--电容使用详述