from selenium import webdriver
# 导入键盘Keys
from selenium.webdriver.common.keys import Keys
import timedriver = webdriver.Chrome()# 检测代码块
try:# 隐式等待,等待标签加载driver.implicitly_wait(10)# 往京东主页发送请求driver.get('https://www.jd.com/')# 通过id查找input输入框input_tag = driver.find_element_by_id('key')# send_keys为当前标签传值input_tag.send_keys('中华字典')# 按键盘的回车键
    input_tag.send_keys(Keys.ENTER)time.sleep(3)'''爬取京东商品信息:公仔名称url价格评价'''# element 找一个# elements 找多个# 查找所有的商品列表good_list = driver.find_elements_by_class_name('gl-item')# print(good_list)# 循环遍历每一个商品for good in good_list:# 通过属性选择器查找商品详情页url# urlgood_url = good.find_element_by_css_selector('.p-img a').get_attribute('href')print(good_url)# 名称good_name = good.find_element_by_css_selector('.p-name em').textprint(good_name)# 价格good_price = good.find_element_by_class_name('p-price').textprint(good_price)# 评价数good_commit = good.find_element_by_class_name('p-commit').textprint(good_commit)str1 = f'''url: {good_url}名称: {good_name}价格: {good_price}评价: {good_commit}\n'''# 把商品信息写入文本中with open('jd.txt', 'a', encoding='utf-8') as f:f.write(str1)time.sleep(10)# 捕获异常
except Exception as e:print(e)# 最后都会把驱动浏览器关闭掉
finally:driver.close()

运行结果:

转载于:https://www.cnblogs.com/cangbao/p/11104512.html

day05 selenium相关推荐

  1. day05 selenium库的基础使用

    selenium请求库实现爬取京东商品信息: 导入selenium库 利用try-catch实现对是否能连接进行异常检测与捕获 get方式向京东主页发送请求 通过id查找iput输入框 send_ky ...

  2. 爬虫day05 动态网站爬取,json模块 selenium , phantomjs , BeautifulSoup

    目录 1.糗事百科-xpath 2.动态网站数据抓取 - Ajax 3.json模块 4.selenium + phantomjs 强大的网络爬虫 1.selenium 2.phantomjs 3.常 ...

  3. Python网络爬虫之图片懒加载技术、selenium和PhantomJS

    引入 今日概要 图片懒加载 selenium phantomJs 谷歌无头浏览器 知识点回顾 验证码处理流程 今日详情 动态数据加载处理 一.图片懒加载 什么是图片懒加载? 案例分析:抓取站长素材ht ...

  4. python爬虫实战-爬取视频网站下载视频至本地(selenium)

    #python爬虫实战-爬取视频网站下载视频至本地(selenium) import requests from lxml import etree import json from selenium ...

  5. python 爬虫day05

    目录: 文章目录 Day05笔记 糗事百科-xpath 目标 : 用户昵称 段子内容 好笑数 评论数 步骤 动态网站数据抓取 - Ajax Day05笔记 糗事百科-xpath 目标 : 用户昵称 段 ...

  6. python 基础 网络爬虫 day05

    目录 1.json模块 2.动态网站数据抓取 - Ajax 3.selenium + phantomjs 强大的网络爬虫组合 day04 lxml解析库 使用流程 from lxml import e ...

  7. Python:Selenium和PhantomJS

    Selenium Selenium是一个Web的自动化测试工具,最初是为网站自动化测试而开发的,类型像我们玩游戏用的按键精灵,可以按指定的命令自动操作,不同是Selenium 可以直接运行在浏览器上, ...

  8. python+selenium浏览器常用操作(一)

    1.导入selenium自定义的webdriver.后续可通过调用此协议启动各大浏览器 from selenium import webdriver #浏览器 from selenium.webdri ...

  9. selenium 不同版本Driver

    selenium进行UI自动化测试需要Driver支持,不同的浏览器需要不同的Driver,之前使用的Driver可以正常运行,但是总会报一些莫名的问题,经过查找,原来IE的Driver需要与sele ...

最新文章

  1. 基于STM32CubeMX创建STM32L496ZGTx的工程
  2. CodeSmith实体类模板
  3. c++ console 取实时输入_灵活使用 console 让 js 调试更简单
  4. collector list 多个分组_Java 8嵌套(多级)分组依据
  5. python 对象引用,可变性,垃圾回收
  6. 来一杯java_初级java笔试题
  7. 开源的shell工具finalShell
  8. Datawhale组队学习:数据竞赛(房价预测)课程任务
  9. 创新创业孵化知识体系-创业实践导论之-技术专栏
  10. Java 常用技术栈 相关概念总结, 更新中...
  11. gmoj 6842. 【2020.11.5提高组模拟】淘淘蓝蓝之扮猪吃愉悦
  12. STM32 ME909 调试难点
  13. 人生的镜像-菌群人生,从出生到死亡的菌群演替
  14. 手机端android app崩溃的常见类型
  15. 学习记录:Monkey测试
  16. ​燕东微科创板上市:市值276亿 亦庄国投与京东方是股东
  17. TCP/IP:认识TCP
  18. libvirt零知识学习3 —— libvirt源码编译安装(1)
  19. Algorithm(算法
  20. CFO和财务VP的OKR案例,打造并领导世界一流的金融团队

热门文章

  1. bat产品经理能力模型_产品经理如何构建自己的产品能力模型?
  2. DLL 远程线程注入
  3. java读取excel数据_Java读取Excel内容(转)
  4. EditPlus3.21注册码
  5. Pixhawk(PX4)之驱动详解篇(0)_前期准备(招贤令)
  6. boot spring test 文档_SpringBoot入门建站全系列(五)使用Spring-data-jpa操作数据库
  7. using(别名)和range based for
  8. ResNeXt 之 输入数据预处理代码详解
  9. 数组赋值给vector和list,顺便说明int和size_t的区别
  10. ofstream与ate的故事 经典!