先说一下selenium 的定位方法
find_element_by_id
find_element_by_name
find_element_by_xpath
find_element_by_link_text
find_element_by_partial_link_text
find_element_by_tag_name
find_element_by_class_name
find_element_by_css_selector
前八种是大家都熟悉的,经常会用到的

1.id定位:find_element_by_id(self, id_)
2.name定位:find_element_by_name(self, name)
3.class定位:find_element_by_class_name(self, name)
4.tag定位:find_element_by_tag_name(self, name)
5.link定位:find_element_by_link_text(self, link_text)
6.partial_link定位find_element_by_partial_link_text(self, link_text)
7.xpath定位:find_element_by_xpath(self, xpath)
8.css定位:find_element_by_css_selector(self, css_selector)

这八种是复数形式
9.id复数定位find_elements_by_id(self, id_)
10.name复数定位find_elements_by_name(self, name)
11.class复数定位find_elements_by_class_name(self, name)
12.tag复数定位find_elements_by_tag_name(self, name)
13.link复数定位find_elements_by_link_text(self, text)
14.partial_link复数定位find_elements_by_partial_link_text(self, link_text)
15.xpath复数定位find_elements_by_xpath(self, xpath)
16.css复数定位find_elements_by_css_selector(self, css_selector

from bs4 import BeautifulSoup
from selenium import webdriver
target = '网页网址'
option = webdriver.ChromeOptions()
option.add_argument('headless')  # 设置option,后台运行
driver = webdriver.Chrome(chrome_options=option)
driver.get(target)

单个按钮需要点击的话,只需要按照上面的1-8条找到需要点击的标签,然后添加click()方法就行了.

result= driver.find_element_by_class_name('需要点击的类名')
result.click()

这样就实现了点击效果
多个按钮需要点击,可以选择复数形式9-16条.然后用对应的类名找到所有的标签,注意这里我用result_list,因为返回的是一个list列表,选择其中第4-7个标签,然后实现分别点击

result_list= driver.find_elements_by_class_name('需要点击的类名')
for i in range(4, 8):result_list[i].click()

接下来就可以对展开的网页进行爬取了

selenium_page = driver.page_source
driver.quit()
soup = BeautifulSoup(selenium_page, 'html.parser')
# one = soup.find('div', {'class': '布拉布拉类名'}) 单个
many= cities.find_all('div', {'class': '咕噜咕噜类名'})  #多个
for i in many:content = i.find_all('p') #找到对应元素nation = content[0].get_text() # 读取内容

谁能仅靠十年寒窗苦读,去经营百岁人生?
活到老,学到老!
知识改变人生!
共勉!

python爬虫+selenium模拟点击+网页内容需要点击打开相关推荐

  1. python爬虫-selenium模拟登录豆瓣获取cookies给requests使用

    1. selenium如何切换到iframe中操作 import time from selenium import webdriverurl = "https://www.douban.c ...

  2. Python爬虫--Selenium模拟用户的键盘鼠标操作

    废话不多说, 直接上代码 1.模拟键盘操作 #!/usr/bin/env python # -*- coding:utf-8 -*-from selenium import webdriver# 要想 ...

  3. [python爬虫]selenium模拟登录京东招聘网,爬取研发类,数据清洗,数据存储,终数据分析和可视化

    目录 引入包 模拟登陆京东网 利用XPath对网页源代码进行解析 数据清洗 每页数据以追加形式保存至csv文件 保存数据到MongoDB数据库,参数为字典组成的列表 数据分析与可视化 总函数 引入包 ...

  4. Python爬虫——selenium模拟京东网站登录(一)

    1.导入需要的库 import time from selenium import webdriver 2.浏览器获取驱动 需要下载跟chrome浏览器相匹配的驱动driverchrome.exe,详 ...

  5. 【python】实验2项目2:使用爬虫Selenium模拟浏览器获取爬取QQ音乐中你喜欢的某位歌手(陈奕迅)

    请使用爬虫Selenium模拟浏览器获取爬取QQ音乐中你喜欢的某位歌手(可以是任意歌手)最受欢迎的前5首歌曲的歌词.流派.歌曲发行时间.评论条数.评论时间.评论点赞次数.评论内容具体(每一首歌的评论& ...

  6. [python爬虫] Selenium常见元素定位方法和操作的学习介绍(转载)

    转载地址:[python爬虫] Selenium常见元素定位方法和操作的学习介绍 一. 定位元素方法 官网地址:http://selenium-python.readthedocs.org/locat ...

  7. python爬虫selenium和bs4_python爬虫――selenium+bs4爬取选股宝‘利好‘or’利空'股票信息...

    一.前言.(1)我个人比较喜欢先看结果,再看内容,so,结果如图: (2)信息抓取自选股宝https://xuangubao.cn/(我这里设定抓取加载20页,下面只列举几个): (3)本次主要应用到 ...

  8. Python 爬虫 Selenium 基本使用

    Python 爬虫 Selenium 基本使用 1. 基础知识 1.1 下载浏览器驱动 1.2 帮助文档 2. 浏览器操作 2.1 浏览器导航 2.2 窗口和选项卡 2.3 Frames and If ...

  9. Python爬虫-Selenium(1)

    Python爬虫-Selenium(1) @(博客)[python, 爬虫, selenium, Python] Python爬虫-Selenium(1) 前言 前期准备 基础使用 进阶使用 浏览器操 ...

  10. [Python爬虫] Selenium+Phantomjs动态获取CSDN下载资源信息和评论

    前面几篇文章介绍了Selenium.PhantomJS的基础知识及安装过程,这篇文章是一篇应用.通过Selenium调用Phantomjs获取CSDN下载资源的信息,最重要的是动态获取资源的评论,它是 ...

最新文章

  1. json取值_Mysql 中json数据存储读取
  2. 【javascript】深入理解对象
  3. 查看平台内核信息脚本
  4. mysql定时备份并上传ftp_Linux下定时任务实现mysql自动备份并上传远程ftp
  5. Maven服务器的使用之Maven桌面项目和Maven Web项目的创建
  6. vue 声明周期函数_vue-router路由守卫-上
  7. spring+hibernate:在applicationCOntext.XML中配置C3P0参数说明
  8. mysql导出导入数据
  9. NRF24L01调试的一些经验之谈
  10. 查看opencv版本
  11. java排序之选择排序
  12. 【游戏角色设计初学入门】游戏角色制作过程及步骤
  13. python ppt 图片_Python批量导出多个PPT\/PPTX文件中每个幻灯片为独立JPG图片
  14. 录屏软件哪个好?电脑录屏软件排行榜推荐
  15. eclipse pull异常 Pulling 1 respository (The pull operation was canceled)
  16. 对客户信息收集,收集用户行为的方法总结
  17. 线性(时不变)系统 非线性系统
  18. 无障碍服务(AccessibilityService)
  19. LaTex论文排版 | (4) LaTex的字体设置
  20. wow服务器维护8月14,8月14日服务器例行维护公告(已完成)

热门文章

  1. Android平板查看网卡mac,如何看电脑网卡和手机mac地址
  2. 古体字与简体字对照表_古代汉语必备简化字与繁体字对照表
  3. 外卖cps美团饿了么小程序 每天领取外卖优惠券 下单直接抵扣现金(外卖cps返利分销小程序源码)
  4. matlab仿真step模块讲解,Simulink仿真教程(最好)
  5. RHEL7的安装步骤
  6. 工业线阵相机与面阵相机特点分析
  7. 模长,方向余弦,方向角、单位向量和方向导数的计算
  8. JavaScript循环刷新页面
  9. 【个人积累】轨道根数六要素中第4、5项的理解与STK仿真演示
  10. java毕业设计易医就医购药交互平台Mybatis+系统+数据库+调试部署