import time
from selenium import webdriver
from lxml import etreedef Run(keywords, numPage):# 构造无头的ChromeDriveroption = webdriver.ChromeOptions()option.add_argument('headless')driver = webdriver.Chrome(executable_path='D:\\Project\\Pycharm\\Driver\\chromedriver.exe', chrome_options=option)# 存放数据list = []for i in range(numPage):url = 'https://uland.taobao.com/sem/tbsearch?refpid=mm_26632258_3504122_32538762&keyword=' + keywords + '&clk1=4ccf3c1994a6f9cc579ec534e8b1bec2&upsId=4ccf3c1994a6f9cc579ec534e8b1bec2&spm=a2e0b.20350158.31919782.1&pid=mm_26632258_3504122_32538762&union_lens=recoveryid%3A201_11.27.9.205_6368855_1626600603206%3Bprepvid%3A201_11.175.82.69_6378466_1626601143040&pnum=' + str(i)# ChromeDriver访问指定URLdriver.get(url)# 等待ChromeDriver打开URL页面time.sleep(3)# ChromeDriver解析指定URL页面html = driver.page_source# 构造etreee = etree.HTML(html)for j in range(1, 61):productName = e.xpath('/html/body/div[2]/div[1]/div[2]/ul/li[' + str(j) + ']/a/div[1]/span/text()')salesVolume = e.xpath('/html/body/div[2]/div[1]/div[2]/ul/li[' + str(j) + ']/a/div[4]/div[2]/text()')shopName = e.xpath('/html/body/div[2]/div[1]/div[2]/ul/li[' + str(j) + ']/a/div[3]/div/text()')price = e.xpath('/html/body/div[2]/div[1]/div[2]/ul/li[' + str(j) + ']/a/div[2]/span[2]/text()')list_tmp = shopName[0], productName[0], price[0], salesVolume[0]list.append(list_tmp)return listif __name__ == '__main__':# 搜索的关键词keywords = "遮阳伞女"# 设置翻页数量numPage = 2data = Run(keywords, numPage)for i in range(len(data)):print(data[i])

默认你的selenium已经适配好ChromeDriver了

内容格式如下:

Python + selenium 爬取淘宝网(销量,店铺名,价格等)相关推荐

  1. python +selenium 爬取淘宝网商品信息

    前几天用python爬取豆瓣关于电影<长城>的影评,发现豆瓣的网页是静态的,心中一阵窃喜.以为对于动态网页了解的不是太多.但是主要是用cookie加headers爬取的.效果还不错,爬取了 ...

  2. Python + selenium 爬取淘宝商品列表及商品评论 2021-08-26

    Python + selenium 爬取淘宝商品列表及商品评论[2021-08-26] 主要内容 登录淘宝 获取商品列表 获取评论信息 存入数据库 需要提醒 主要内容 通过python3.8+ sel ...

  3. 吃货们看好了!python+selenium爬取淘宝美食

    前言 今天为大家介绍一个利用Python的selenium打开浏览器的方式来爬去淘宝美食,这个小案例涵盖了selenium的基本知识点,如何打开浏览器以及关键字的搜索 导入第三方库 打开浏览器 搜索功 ...

  4. python +Selenium 爬取淘宝商品评论

    第一步 现在淘宝防爬取做的比较好,如果直接爬的话总是出现登陆界面.从而获取不到信息. 解决办法,新建 淘宝.py import json from selenium import webdriver ...

  5. 使用python selenium爬取淘宝商品信息 自动登录淘宝和爬取某一宝贝的主图,属性图和详情图等等

    selenium作为一个自动化测试工具非常好用,谁用谁知道啊. 先说如何登录淘宝,淘宝现在直接用会员名和密码登录会有滑块验证,找了网上说的几种方法和自己尝试了一番效果还是不太理想,实测过程中,即使滑块 ...

  6. python+selenium爬取淘宝商品信息+淘宝自动登录——爬虫实战

    1.前言 继续学习爬虫内容,这回是以selenium模拟操作进行抓取,其中有几个需要登陆的注意事项. 2.自动登陆+查找页面 由于现在淘宝的反爬机制,需要登陆才好下一步操作.在搜索输入后页面会调入登陆 ...

  7. Python selenium 爬取淘宝商品

    Catalog 翻页 获取动态页面信息 提取商品信息 完整代码 翻页 from urllib import parse domain = 'https://s.taobao.com/search?' ...

  8. 爬虫(6)-使用selenium爬取淘宝天猫商品信息(价格,销售量等)

    文章目录 1.只读取第一页 1.1准备工作 1.2.定位 1.3.获取商品信息 1.4. 整体代码 1.5.输出结果展示 1.6改进,存储在CSV文件内并分行存储 2.读取多页商品信息 2.1部分问题 ...

  9. python爬淘宝商品销量信息_python爬取淘宝商品销量信息

    python爬取淘宝商品销量的程序,运行程序,输入想要爬取的商品关键词,在代码中的'###'可以进一步约束商品的属性,比如某某作者的书籍,可以在###处输入作者名字,以及时期等等.最后可以得到所要商品 ...

最新文章

  1. 执行计划组件、组件、老化
  2. 网站维护:Linux服务器查看外网访问IP指令汇总
  3. 一步步实施 DevOps (三)
  4. MTK for Google AttestationKey介绍
  5. 转:求多边形的面积 算法几何
  6. 错误 error C2220: 警告被视为错误 - 没有生成“object”文件
  7. Java黑皮书课后题第8章:**8.36(拉丁方阵)拉丁方阵是一个n*n的数组,其中有n个不同的拉丁字母,并且每个拉丁字母恰好只在每行和每列中出现一次。编写一个程序,提示用户输入数字n和字符数组
  8. c语言 数组递减输出,合并两个线性表(数组)并按照非递减排序输出,有点问题过来看看...
  9. 那些年,登山徒步记录,立贴
  10. cass绘制围墙lisp_CASS中用LISP完成高程值的可视化处理
  11. bash 中的行处理命令 awk
  12. (c语言)输入某年某日,判断这一天是这一年的第几天?
  13. 自己对Java的一些认识
  14. typedef 与结构体struct
  15. JAVA JSP网上订餐系统JSP餐厅点餐系统源码JSP点餐系统JSP网上订餐系统JSP在线订餐
  16. r语言 svycoxph_R语言之生信⑦Cox比例风险模型(单因素)
  17. 坚果云企业版服务器端,坚果云企业版常见问题解答
  18. 鸿蒙系统怎么设置上网速度,苹果手机上网速度慢怎么办!手把手教你如何解决...
  19. EPT和VPID简介
  20. 小甲鱼零基础学习python_19 【pickle -- 腌制一缸泡菜】

热门文章

  1. 请确保加密服务正在此计算机上运行,安装程序无法验证安装所需文件的完整性,请确保正在此计算机上运行加密服务...
  2. 软件设计模式--第二章 创建型模式--建造者模式
  3. Ueeshop:外贸网站报价,从免费到数十万是怎么回事?
  4. matlab求莱斯分布pdf,Matlab累积分布函数cdf与概率密度函数pdf
  5. Inceptionism Going Deeper into Neural Networks
  6. 一些软件测试与C语言面试题
  7. TokenGazer CEO 范宏达:项目的技术架构决定其未来的发展前景
  8. 百度地图SDK导航功能初始化错误
  9. Centos7安装Squid代理服务及配置透明代理
  10. 金蝶ERP实现产品入库及委外加工冲减生产现场虚仓毛坯数(终结版)