代码实例

# -*-.coding: utf-8 -*-
# __author__ = 'xiaobai'
# Email: 517840374@qq.com
import time
import re
from selenium.webdriver import Chrome # 导入浏览器的包
from selenium.webdriver.common.keys import Keys
n = 1
# 创建浏览器
web = Chrome()
# 打开浏览器,请求到拉钩
web.get("https://www.lagou.com")
web.find_element_by_xpath('//*[@id="cboxClose"]').click()time.sleep(1)
# 找到那个文本框,输入python,然后点查询
web.find_element_by_xpath('//*[@id="search_input"]').send_keys('python', Keys.ENTER)alst = web.find_elements_by_class_name("position_link")
for a in alst:# 找到H3并点击a.find_element_by_tag_name("h3").click()web.switch_to.window(web.window_handles[-1])text= web.find_element_by_xpath('//*[@id="job_detail"]/dd[2]').text # 拿文本# 把招聘信息保存到文件中with open(f'需求_{n}.txt', mode = 'w',encoding='utf-8') as f:f.write(text)n += 1# 关闭窗口web.close()# 调整窗口到最开始的那个页面web.switch_to.window(web.window_handles[0])time.sleep(1)

转载于:https://www.cnblogs.com/alex3174/p/11379854.html

python爬虫实例--爬取拉勾网相关推荐

  1. AJAX教程美食滤镜,Python爬虫实例——爬取美团美食数据

    1.分析美团美食网页的url参数构成 1)搜索要点 美团美食,地址:北京,搜索关键词:火锅 2)爬取的url https://bj.meituan.com/s/%E7%81%AB%E9%94%85/ ...

  2. Python爬虫实例-爬取豆瓣电影Top250

    这是本人Python爬虫实例的第二个实例,不过想来好像没有很大的难度所以适合当做新手入门的第一个爬虫.放在这里供大家参考. 本次实例爬取的网站为豆瓣电影Top250,使用到的第三方库有urllib,B ...

  3. Python爬虫:爬取拉勾网职位并分析

    大数据杂谈 一起行走数据江湖! 作者:闲庭信步 原文链接: https://blog.csdn.net/danspace1/article/details/80197106 如需转载,请联系原作者. ...

  4. Python爬虫 senlenium爬取拉勾网招聘数据,你学会了吗

    一.基本思路 目标url:https://www.lagou.com/ 用selenium爬虫实现,输入任意关键字,比如 python 数据分析 ,点击搜索,得到的有关岗位信息,爬取下来保存到Exce ...

  5. Python 爬虫实例+爬取豆瓣小组 + wordcloud 制作词云图

    目标 利用PYTHON爬取如下图中所有回答的内容,并且制作词云图. 用到的库 import requests # import jsonfrom PIL import Image from pyque ...

  6. python爬虫实例--爬取电脑壁纸

    目录 前言 一.用到的工具 二.爬取步骤与过程 1.用到的库 2.解析代码 三.最后上全部的代码啦 最后感悟 前言 听说好的编程习惯是从写文章敲代码开始的,下面给大家介绍一个简单的python爬取图片 ...

  7. python爬虫senlenium爬取拉勾网招聘数据!

    一.基本思路 目标url:https://www.lagou.com/ 用selenium爬虫实现,输入任意关键字,比如 python 数据分析,点击搜索,得到的有关岗位信息,爬取下来保存到Excel ...

  8. python爬虫 senlenium爬取拉勾网招聘数据

    文章目录 一.基本思路 二.selenium爬虫 三.查看数据 原文链接:https://yetingyun.blog.csdn.net/article/details/108170411 创作不易, ...

  9. 爬虫python 新闻,Python爬虫实例--爬取人民网新闻

    其实我只是因为在那边评论区想评论,然后发现位置不够,所以才打算写这个博客的,然后具体的可以看我转载的文章,很详细,我这边只说一下关于txt转换为JSON格式的问题 第一次写,格式可能很乱,见谅一下 话 ...

最新文章

  1. 言论丨马库斯回应14大质疑,重申深度学习怀疑论
  2. HOWTO: InstallShield中通过修改注册表关闭Vista/Windows 7的UAC
  3. win2008在组件服务中未找到office组件服务
  4. Windows 7各版本主要区别
  5. linux 设备管理工具 udev 规则编写
  6. C++ Primer 学习笔记_75_模板与泛型编程 --模板定义
  7. jquery.ajax
  8. 研究生念了些什么东西?
  9. UML类图画法及类之间几种关系
  10. 多任务Python爬虫
  11. 论文阅读:Single Image Dehazing via Conditional Generative Adversarial Network
  12. pyTorch api
  13. php 加载慢,PHP版网站缓存加快打开速度的方法分享
  14. UVA10407 Simple division【同余+一阶差分】
  15. android 自定义view 水波纹进度球
  16. 黑客事件中如何实现利益最大化?
  17. iOS底层探索之多线程(三)—初识GCD
  18. 创建phpinfo.php
  19. LTE下行资源分配type0、type1、type2
  20. 车间和仓库可以一起吗_车间和仓库可以划分为一个防火分区吗

热门文章

  1. eclipse配置tomcat8.5
  2. 【转】解决wine中文乱码的问题
  3. java(十六) 对象的this引用
  4. JavaWeb--数据库添加
  5. JMeter学习笔记--JMeter监听器
  6. FireFox and IE CSS兼容要点
  7. 转:开火,移动-大神Joel 也浮躁
  8. c语言解一维波动方程,python绘制一维波动方程(初学者)
  9. 转 詹宏志谈数字出版
  10. VBS脚本和HTML DOM自动操作网页