本人是个学python爬虫不久的小白,爬取腾讯招聘的一页招聘消息,用了两天的时间,可能爬取的消息没有那么全,也没有保存在文件夹里或者数据库,我只是为了增加我的爬取经验,发帖也是为了记录。

from selenium.webdriver import Chrome
from selenium.webdriver.chrome.options import Options
import time
# 加载插件
options = Options()
options.add_argument('--disable-blink-features=AutomationControlled')
options.add_experimental_option('useAutomationExtension', False)
options.add_experimental_option('excludeSwitches', ['enable-automation'])
web = Chrome(options=options)
self = web.get('https://join.qq.com/post.html?pid=1')
time.sleep(1)  # 页面加载
# 腾讯的页面需要向下滚动才能加加载出我们想要的代码
js = "window.scrollTo(0,100)"
web.execute_script(js)
time.sleep(1)
li_list = web.find_elements_by_xpath('//ul[1]/li')
for li in li_list:x = 1item = {}i = li.find_elements_by_xpath('./div[1]')  # 得到的时list类型j = li.find_elements_by_xpath('./div[2]/div[1]')for item['post_title'] in i:print(item['post_title'].text)for item['post__tag'] in j:if len(item['post__tag'].text) > 1:print(item['post__tag'].text)else:continueli = web.find_element_by_xpath(f'//ul[1]/li[{x}]').click()web.switch_to.window(web.window_handles[-1])  # 进入招聘信息的具体一页页time.sleep(0.5)web.execute_script(js)time.sleep(0.5)resp = web.find_elements_by_xpath('//*[@id="app"]/div/div[2]/div/ul/li[2]/div[2]/p')for i in resp:print(i.text)web.close()  # 关闭具体信息的一页web.switch_to.window(web.window_handles[0])  # 回到第一页x += 1

注释的内容不多,可能代码有一些多余的地方,我学爬虫也是在b站学的,可能学的不太基础不好,有些语句写得不好,或者可以怎么修改的地方,可以说出来。

抓取腾讯校园招聘的第一页相关推荐

  1. Scrapy小白爬取智联校园招聘

    前言 掌握了一部分爬虫基础后开始学习Scrapy分布式爬虫,最初觉得会很难,以为分布式就是像hadoop分布式部署一样去配置很多文件,后来发现Scrapy相比普通python爬虫逻辑更简单,速度更快, ...

  2. python抓取腾讯视频弹幕_Python实战 | 如何抓取腾讯视频弹幕

    原标题:Python实战 | 如何抓取腾讯视频弹幕 当代年轻人的快乐是网络给的. 如果有人吐槽周末太无聊,他们一定会反驳: 是追剧不香吗? 是吃鸡不好玩吗? 周末辣么短,怎么会无聊呢? 诚然,追剧和游 ...

  3. Python爬虫实战,requests模块,Python实现抓取腾讯视频弹幕评论

    前言 利用Python实现抓取腾讯视频弹幕,废话不多说. 让我们愉快地开始吧~ 开发工具 Python版本: 3.6.4 相关模块: requests模块: pandas模块 以及一些Python自带 ...

  4. android:获取富文本图片和使用Jsoup抓取腾讯新闻网页数据

    先看效果: 获取富文本中的图片 抓取腾讯新闻中的图片 首先引入要使用的jar包 compile 'jp.wasabeef:glide-transformations:2.0.2'compile 'or ...

  5. 使用Selenium+PhantomJS抓取腾讯动漫漫画图链接

    前言 上周一位朋友在进行一些项目开发时,其中需要用到腾讯动漫中动漫的图片,但是自己手动一张一张另存为图片进行保存太浪费时间了,于是就用Python来进行抓取,但是很无奈腾讯动漫的章节动漫DOM元素是异 ...

  6. Python爬虫实现抓取腾讯视频所有电影-源码【实战必学】

    用python实现的抓取腾讯视频所有电影的爬虫 1. # -*- coding: utf-8 -*-2. import re3. import urllib24. from bs4 import Be ...

  7. python爬取boss直聘招聘信息_Python爬虫实战-抓取boss直聘招聘信息

    Python Python开发 Python语言 Python爬虫实战-抓取boss直聘招聘信息 实战内容:爬取boss直聘的岗位信息,存储在数据库,最后通过可视化展示出来 PS注意:很多人学Pyth ...

  8. 八爪鱼数据抓取,智联招聘为例

    八爪鱼数据抓取,智联招聘为例 一.八爪鱼抓取智联招聘信息 1.1 打开八爪鱼采集器==>选择快速开始==>新建任务(高级模式) 1.2点击下一步 基本流程如下点击下一步 1.3启动单机采集 ...

  9. python热力图分析_使用Python抓取腾讯宜出行热力图数据实战

    1.jpg (42.83 KB, 下载次数: 0) 2018-5-12 19:05 上传 1.具体的抓取程序已经放在后面了,供大家下载安装,下面具体说一下使用方法. 本软件使用了渔网形式来抓取腾讯宜出 ...

  10. 火山PC抓取快递物流查询接口教程第一课

    本源码转载自利快云https://www.lkuaiy.com/ 火山PC抓取快递物流查询接口教程第一课 一.准备工作 工具:精易编程助手,易语言绝佳伙伴,同样适用于火山 下载地址: http://s ...

最新文章

  1. MySQL之查询性能优化(四)
  2. vue.js 三种方式安装--npm安装
  3. python内建函数是什么意思_Python3内建函数简介,Python3内建函数详解
  4. pyqt5 判断lineedit是否为空_是否注意过 isEmpty 和 isBlank 区别?
  5. css 文字可选,在HTML5中如何使用CSS建立不可选的文字
  6. Qt QT的I/O流 QT输入输出
  7. delete postman 传参_Postman高级应用——串行传参和动态传参详解
  8. mcgs组态软件中字体如果从左到右变化_MCGS脚本程序 -
  9. linux电源管理配置,Arch Linux 如何修改默认电源管理设置
  10. 理解马尔可夫决策过程
  11. 学生用计算机的感叹号在哪,感叹号怎么打电脑(感叹号的用法及举例)
  12. uoj #172. 【WC2016】论战捆竹竿
  13. WiFi 信号强度和网速有关系吗?
  14. 手机日常使用技巧、和手机停机如何免费上网 。好多大家不知道的功能:不看后悔哦
  15. 15种独一无二的创新数据可视化方式
  16. 慧极必伤,情深不寿,强极则辱;谦谦君子,温润如玉
  17. 同余及其性质(Congruence)
  18. 不用电脑的便携式编程机器人教育全过程供应商
  19. 风雨二十年互联网中国之路
  20. JavaScript下搭建ag-grid

热门文章

  1. android 常用action和category
  2. 安装BiocManager显示Warning in install.packages : package ‘BiocManager’ is not available for this version
  3. 读《创业36条军规》(三)学先进 傍大款 走正道
  4. Metro 风格页面设计
  5. LT培训Hadoop
  6. 国产手机提价终遭受重大损失,降价的苹果反而逆势增长
  7. 使用Java实现给QQ邮箱发送验证码
  8. (7)开机动画2D版,开机动画3D版
  9. N卡电脑Ubuntu20.04+N卡驱动安装+windows11双系统安装(不符合条件的电脑也可以安装win11)2021.11.13
  10. Ubuntu删除U盘分区,并格式化U盘