一.说明

淘宝商品的爬取,主要用到selenium和css选择器,本案例难度较低可以用作selenium的入门。
注意:扫码登录是手动操作

二.代码演示

from selenium import webdriver
from selenium.webdriver.common import keys
import time
import requests
import os# 创建浏览器
browser = webdriver.Chrome(r'D:\ChromeCoreDownloads\chromedriver.exe')
# 让浏览器打开淘宝
browser.get("https://www.taobao.com/")# 找到搜索框输入内容并搜索
browser.find_element_by_xpath('//*[@id="q"]').send_keys("男鞋", keys.Keys.ENTER)
time.sleep(1)
# 切换成二维码登录
browser.find_element_by_xpath('//*[@id="login"]/div[1]/i').click()# 判断当前页面是否为登录页面
while browser.current_url.startswith("https://login.taobao.com/"):print("等待用户输入")time.sleep(1)print("登录成功!!!")
n = 1
count = 1# 创建淘宝目录
os.mkdir(".\\淘宝图片")while True:items = browser.find_elements_by_css_selector('.m-itemlist .items > div')for item in items:# 获取这张图片的下载地址img = item.find_element_by_css_selector(".pic-box .pic img").get_attribute("data-src")# 拼接完成的下载地址img_url = "http:" + imgprint(img_url)# 通过requests下载这张图片file = open(f".\\淘宝图片\\{n}.jpg", "wb")file.write(requests.get(img_url).content)n += 1# 翻页操作browser.find_element_by_css_selector('.wraper:nth-last-child(1) .next > a').click()time.sleep(2)count += 1# 爬取 4 页内容if count == 4:# file.close()break# 关闭浏览器
browser.quit()

三.运行结果

【python爬虫】selenium爬取淘宝商品图片相关推荐

  1. Python爬虫+selenium——爬取淘宝商品信息和数据分析

    浏览器驱动 点击下载chromedrive .将下载的浏览器驱动文件chromedriver丢到Chrome浏览器目录中的Application文件夹下,配置Chrome浏览器位置到PATH环境. 需 ...

  2. python使用Selenium爬取淘宝商品信息

           由于淘宝对自动化工具进行了识别,直接进入登录页面滑动二维码一直会报错,所以采取了曲线救国的方式,通过用微博账号来登录淘宝.刚自学<Python3网络爬虫开发实战>,和里面的代 ...

  3. 爬虫--selenium爬取淘宝商品数据

    # 导入包 from selenium import webdriver # 连接驱动器,这里用的是谷歌,版本必须对应 driver = webdriver.Chrome(executable_pat ...

  4. Python,自己修改的爬取淘宝网页的代码 修改Python爬虫,爬取淘宝商品信息也不报错,也不输出信息的错误

    代码部分: 下面是正确的: import requests import redef getHTMLText(url):try:r = requests.get(url, timeout = 30)r ...

  5. python爬虫——用selenium爬取淘宝商品信息

    python爬虫--用selenium爬取淘宝商品信息 1.附上效果图 2.淘宝网址https://www.taobao.com/ 3.先写好头部 browser = webdriver.Chrome ...

  6. Python + selenium 爬取淘宝商品列表及商品评论 2021-08-26

    Python + selenium 爬取淘宝商品列表及商品评论[2021-08-26] 主要内容 登录淘宝 获取商品列表 获取评论信息 存入数据库 需要提醒 主要内容 通过python3.8+ sel ...

  7. 利用Selenium爬取淘宝商品信息

    文章来源:公众号-智能化IT系统. 一.  Selenium和PhantomJS介绍 Selenium是一个用于Web应用程序测试的工具,Selenium直接运行在浏览器中,就像真正的用户在操作一样. ...

  8. 使用Selenium爬取淘宝商品(绕过登录页面)

    文章目录 1.准备工作 2.接口分析 3.页面分析 4.获取商品列表 5.解析商品列表 6.保存到MongoDB 7.遍历每页 8.异常处理(绕过登录反爬机制) 方法一:修改ChromeDriver. ...

  9. python+scrapy简单爬取淘宝商品信息

    python结合scrapy爬取淘宝商品信息 一.功能说明: 已实现功能: 通过scrapy接入selenium获取淘宝关键字搜索内容下的商品信息. 待扩展功能: 爬取商品中的全部其他商品信息. 二. ...

最新文章

  1. python硬件编程智能家居_利用 Python 的力量,实现 Tableau 与智能家居系统集成
  2. 万物上链: 5G 起跑
  3. 小米路由器添加扩展工具_小米正式发布miVela软件平台,与各方共同合作推进物联网发展...
  4. tab标签的另一种写法
  5. P4201-[NOI2008]设计路线【结论,树形dp】
  6. 95后大学生利用漏洞免费吃肯德基获刑;Linux内核初步支持苹果M1;Android Studio 4.2 发布|极客头条...
  7. rust投递箱连接箱子_海门市围板箱定制围板箱内衬
  8. 【ant Design vue使用腾讯播放器实现监控视频直播、点播,多个视频同时播放】
  9. 马拉车算法(Manacher's Algorithm)
  10. python考试分几级_全国计算机等级考试2级分几类?到底怎么考啊?
  11. 昨天疯传朋友圈的 Pony 马化腾的讲话,未来是全真互联网时代,又一场大洗牌即将开始...
  12. 【文本编辑】PPT文档被设置密码允许只读模式【解除限制】
  13. oracle bpm 集成erp,我们已经执行了ERP系统,为什么还要使用BPM系统?
  14. 基于yolov5+deepsort的智能售货机商品目标检测种类识别计数
  15. XCTF-攻防世界CTF平台-Reverse逆向类——52、handcrafted-pyc(Python的pyc文件逆向)
  16. 服务器的种类以及各自的区别
  17. What is outlier?
  18. 深度学习实践与大数据实践【二】
  19. linux dae文件下载,linux dae命令详解.doc
  20. Linux中的火墙管理

热门文章

  1. Putty配色方案更改
  2. [碎碎念]我都惊呆了...
  3. 用Python和OpenCV库实现识别人物出现并锁定
  4. OpenET ——开放的可视化美国蒸散发平台
  5. 13.学习Camera之——Android Treble架构解析
  6. ZZULIOJ:1018: 奇数偶数
  7. 俄罗斯方块双人对战版
  8. 全网最简单的软渲染器
  9. 自动循环播放的MP3播放器
  10. 全国各地出现巨坑,2012世界末日大预言