利用python爬取淘宝的商品图片!
代码
from selenium import webdriver
from selenium.webdriver.common import keys
import time
import requests
import random# 创建浏览器
def functions():browser = webdriver.Chrome(r'G:\taobao\chromedriver.exe')# 让浏览器打开淘宝browser.get("https://www.taobao.com/")# 找到搜索框输入内容并搜索browser.find_element_by_xpath('//*[@id="q"]').send_keys("便携果汁杯", keys.Keys.ENTER)time.sleep(1)# 切换成二维码登录browser.find_element_by_xpath('//*[@id="login"]/div[1]/i').click()# 判断当前页面是否为登录页面while browser.current_url.startswith("https://login.taobao.com/"):print("等待用户输入")time.sleep(1)print("登录成功!!!")n = 1count = 1while True:items = browser.find_elements_by_css_selector('.m-itemlist .items > div')for item in items:# 获取这张图片的下载地址img = item.find_element_by_css_selector(".pic-box .pic img").get_attribute("data-src")# 拼接完成的下载地址img_url = "http:" + img# print(img_url)# 通过requests下载这张图片sleep_time = random.random()*10time.sleep(sleep_time)# 文件夹需要手动创建好file = open(f"G:\\果汁杯-淘宝\\{n}.jpg", "wb")file.write(requests.get(img_url).content)print("下载图片" + str(n))n += 1# 翻页操作browser.find_element_by_css_selector('.wraper:nth-last-child(1) .next > a').click()time.sleep(2)count += 1# 爬取 4 页内容if count == 6:# file.close()break# 关闭浏览器browser.quit()if __name__ == '__main__':functions()
下载Chromedriver
淘宝本身是有反爬虫机制的,需要使用到浏览器进行模拟人工爬取数据。 下载地址:http://npm.taobao.org/mirrors/chromedriver/86.0.4240.22/
将下载好的压缩包解压到你想要的某个文件夹中,并替换掉一下路径即可
之后运行脚本即可
PS:如有需要Python学习资料的小伙伴可以加点击下方链接自行获取
python免费学习资料以及群交流解答点击即可加入
利用python爬取淘宝的商品图片!相关推荐
- 利用python爬取淘宝的商品图片
代码 from selenium import webdriver from selenium.webdriver.common import keys import time import requ ...
- 用Python爬取淘宝网商品信息
用Python爬取淘宝网商品信息 转载请注明出处 网购时经常会用到淘宝网 点我去淘宝但淘宝网上的商品琳琅满目,于是我参照中国大学 MOOC的代码写了一个爬取淘宝网商品信息的程序 代码如下: impor ...
- python电商数据挖掘_利用Python爬取淘宝商品并数据挖掘与分析实战!此乃大型项目!...
项目内容 本案例选择>> 商品类目:沙发: 数量:共100页 4400个商品: 筛选条件:天猫.销量从高到低.价格500元以上. 项目目的 1. 对商品标题进行文本分析 词云可视化 2. ...
- 利用Selenium爬取淘宝商品信息
文章来源:公众号-智能化IT系统. 一. Selenium和PhantomJS介绍 Selenium是一个用于Web应用程序测试的工具,Selenium直接运行在浏览器中,就像真正的用户在操作一样. ...
- python爬取淘宝商品图片
python爬取淘宝商品的图片 话不多说,直接上代码: from selenium import webdriver from selenium.webdriver.common import key ...
- python使用requests库爬取淘宝指定商品信息
python使用requests库爬取淘宝指定商品信息 在搜索栏中输入商品 通过F12开发者工具抓包我们知道了商品信息的API,同时发现了商品数据都以json字符串的形式存储在返回的html内 解析u ...
- python爬取淘宝全部『螺蛳粉』数据,看看你真的了解螺蛳粉吗?
01.前言 上一篇文章(爬取淘宝热卖商品并可视化分析,看看大家都喜欢买什么!)爬取分析了淘宝的热卖商品,从分析来看『螺蛳粉』的销量巨高.因此这篇文章将爬取淘宝全部『螺蛳粉』商品数据,通过可视化分析淘宝 ...
- python爬淘宝app数据_一篇文章教会你用Python爬取淘宝评论数据(写在记事本)
[一.项目简介] 本文主要目标是采集淘宝的评价,找出客户所需要的功能.统计客户评价上面夸哪个功能多,比如防水,容量大,好看等等. [二.项目准备工作] 准备Pycharm,下载安装等,可以参考这篇文章 ...
- python 爬取淘宝网课
python爬取淘宝网课,打开web控制台,发现有个链接可以下载到对应的内容,下载的格式是m3u8,用文本打开里面是许多.ts链接,当然百度后得知可以直接下个vlc然后下载,但是还是想用python试 ...
最新文章
- 2019-2021年中国AI芯片市场预测与展望数据
- AI居然能算出情侶能交往多久?使用分析语音数据進行預測
- 服务器功率一般多少_单机柜供电能力提升后,选择1U服务器还是2U服务器?
- 手把手部署Linux下磁盘配额(quota)应用与实战
- OSChina 周六乱弹 —— 老用户与狗
- UML大战需求分析阅读笔记——03
- php如果字符串有1 3 5,Day3-php 字符串1
- 啊!多么痛的领悟···
- 电力企业信息化系统主要报表展示
- 深度理解依赖注入(Dependence Injection)
- 忽略证书_中专考生注意!忽略这一点,四科全过也拿不到执业药师证书!
- 天寒宜早睡,梦醒闻雪声,倒计时83
- ubuntu c/c++ 生成.so 并被python调用
- AAA标准-RADIUS协议
- 1336. 每次访问的交易次数
- 计算机一级ppt加水印,2017年计算机一级WPS辅导:WPSOffice2007中插入水印和改变背景色...
- python opencv 实现图像白平衡
- 分享一些Photoshop的教程电子档(pdf格式),初学者与设计师适用
- java凑数问题,包子凑数——Java
- 腾讯企业邮箱HTTPS设置
热门文章
- 探讨标准的采购外协“Subcontract”流程(一)
- 我的Ubuntu初始化配置
- Bootstrap typeahead使用问题记录及解决方案
- 从互联网+角度看云计算的现状与未来(1)
- 每一个学习编程的人都应该有梦想
- 杂谈——什么是Google Fuchsia ?
- sp_depends
- php面试英文自我介绍范文,英文自我介绍范文分享
- 计蒜之道2019 复赛 D-星云系统(单调栈)
- 招生通知+4,北京大学计算机学院+中国科学技术大学信息技术学院+吉林大学人工智能学院+深圳大学计算机学院