这个单子还是没有做成功,本来觉得要成功了,可是,在爬取到第15页就爬不了,很难受,如果有大佬看到这个单子希望能帮我解决下

# 导入Selenium的webdriver类
from selenium import webdriver
from time import sleep
# 设置url变量保存要访问的网站
url = "https://www.baidu.com/s?rtt=1&bsst=1&cl=2&tn=news&rsv_dl=ns_pc&word=%E7%BD%91%E8%B4%B7"
# 将webdriver类实例化,将浏览器设置为谷歌
# 参数executable_path是我们chromedriver.exe的路径
path = r"chromedriver.exe"
browser = webdriver.Chrome(executable_path=path)
# 打开浏览器并访问目标网站
i=0
while True:browser.get(url)elements=browser.find_elements_by_xpath('//*[@id="content_left"]/div[2]/div/h3/a')for t in elements:print(t.text)browser.find_element_by_xpath('//*[@id="page"]/a[10]').click()url=browser.current_urli=1+iprint('第{}页'.format(i))sleep(2)

20200203_selenium爬取百度新闻相关推荐

  1. python爬百度新闻_13、web爬虫讲解2—Scrapy框架爬虫—Scrapy爬取百度新闻,爬取Ajax动态生成的信息...

    crapy爬取百度新闻,爬取Ajax动态生成的信息,抓取百度新闻首页的新闻rul地址 有多网站,当你浏览器访问时看到的信息,在html源文件里却找不到,由得信息还是滚动条滚动到对应的位置后才显示信息, ...

  2. 【python 爬虫】 scrapy 入门--爬取百度新闻排行榜

    scrapy 入门–爬取百度新闻排行榜 环境要求:python2/3(anaconda)scrapy库 开发环境:sublime text + windows cmd 下载scrapy(需要pytho ...

  3. python爬取百度新闻所有的新闻的前1页 标题和URL地址

    这是我自己写的一个爬取百度新闻的一个代码,欢迎大家多来讨论,谢谢!(自己已经测试可以使用,在文章最后见效果图) ''' re模板:2.2.1 requests模板:2.18.4 bs4模板:4.6.0 ...

  4. python爬虫案例——python爬取百度新闻RSS数据

    全栈工程师开发手册 (作者:栾鹏) python教程全解 各RSS网站参考http://blog.csdn.net/luanpeng825485697/article/details/78737510 ...

  5. python爬取百度新闻_火车浏览器网络爬虫实践6:以“陕茶”为例爬取百度新闻搜索结果...

    每天进步一点点,这是我2019年的小目标. 这是第6次学习与实践笔记了,这一次咱们把对象转移到百度搜索去,尝试使用火车浏览器爬虫工具来采集百度新闻搜索的结果,并做简单数据可视化展示. 01 抓取需求 ...

  6. 使用python爬虫爬取百度新闻,告诉你社会热点话题

    1.网络爬虫基础使用 (1)urllib介绍: urllib中包括了四个模块,包括: urllib.request:可以用来发送request和获取request的结果 urllib.error:包含 ...

  7. python爬取百度新闻采集教程

    各位站长朋友大家好,今天小编继续给大家分享一下我们在做SEO文章收录的时候,如何寻找采集目标网站,还有关键词的设置.掌握这两个方法的目的呢是让你批量的能够找到更多的文章,同时可以把文章的标题和文章的内 ...

  8. 爬取百度新闻标题和链接

    使用python爬取新闻标题及链接,解析数据保存为excel文件. import re import requests from lxml import etree import pandas as ...

  9. 爬虫(利用正则表达式爬取百度新闻(淘宝))

    先直接在百度新闻中搜索"淘宝" 得到url = """ https://www.baidu.com/s?ie=utf-8&medium=0&a ...

  10. python爬百度新闻_PY爬取百度新闻搜索所有结果

    #!/usr/bin/python # -*- coding: utf-8 -*- #coding=utf-8 from bs4 import BeautifulSoup import request ...

最新文章

  1. 【武书连】2021 中国一流大学名单(30 所)和中国大学综合实力 700 强出炉!
  2. 【设计模式】适配器模式 ( 概念 | 适用场景 | 优缺点 | 外观模式对比 | 适配器模式相关角色 | 类适配器 | 对象适配器 | 实现流程 )
  3. k8s证书配置:为 kubelet 配置证书轮换
  4. 【推荐系统】推荐系统冷启动问题
  5. 7款Flash和Javascript网页视频播放器
  6. ReviewForJob(1)数据结构与算法分析引论
  7. “睡服”面试官系列第十九篇之async函数(建议收藏学习)
  8. java redis 重连_突破Java面试(23-4) - Redis 复制原理
  9. 原生js 样式的操作整理
  10. 网站的服务器怎么维护,网站服务器怎么维护
  11. Tensorflow 卷积神经网络(三)池化与采样
  12. 20亿条记录的MySQL大表,我们这样迁移的
  13. 牛顿迭代法 解 二元高次方程组 Mathematica
  14. 分享下天酬汇怎么做才好上手
  15. 无需打开软件排版设计海报的在线工具!
  16. Fuchsia OS 现已支持第二代 Nest Hub
  17. Free Pascal IDE安装
  18. 如何判断两个ip地址是否在同一个网段
  19. python安全开发-多线程目录扫描端口扫描子域名爆破dou瓣属性爬取
  20. H5页面使用qq客服功能

热门文章

  1. FragmentPagerAdapter加载fragment并使用setUserVisibleHint()处理预加载时遇到的坑,给textview赋值时出现的空指针异常...
  2. HDU 2895 贪心 还是 大水题
  3. Android中导入Unity项目,界面点击事件失去焦点问题
  4. linux 中ifconfig命令 结果解释
  5. 【react】 redux 公共状态管理---数据的渲染,数据的修改,再把修改的数据渲染到当前组件...
  6. python全栈开发-Day3 字符串
  7. MyBatis -- 对表进行增删改查(基于注解的实现)
  8. Zookeeper启动失败,报错 can not open chanel to 2
  9. 从北京站到天通苑怎么走,
  10. BZOJ 4556(后缀数组+主席树求前驱后继+二分||后缀数组+二分+可持久化线段树)