爬取淘宝商品信息时如何获取cookie

###一、基本环境
1.win10系统
2.火狐浏览器
3.编程软件anaconda
4.淘宝的robots:https://www.taobao.com/robots.txt
###二、参考代码,嵩天python网络爬虫与信息提取

#CrowTaobaoPrice.py
import requests
import redef getHTMLText(url):headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:94.0) Gecko/20100101 Firefox/94.0',#获取cookie时不能用搜索商品后的cookie,必须用刚打开淘宝时的cookie'Cookie': '#获取cookie时不能用搜索商品后的cookie,我用的是刚打开淘宝时的cookie'}try:r = requests.get(url, timeout=30, headers=headers)r.raise_for_status()r.encoding = r.apparent_encoding#print(r.text)return r.textexcept:return ""def parsePage(ilt, html):try:plt = re.findall(r'\"view_price\"\:\"[\d\.]*\"',html)tlt = re.findall(r'\"raw_title\"\:\".*?\"',html)for i in range(len(plt)):price = eval(plt[i].split(':')[1])title = eval(tlt[i].split(':')[1])ilt.append([price , title])except:print("")def printGoodsList(ilt):tplt = "{:4}\t{:8}\t{:16}"print(tplt.format("序号", "价格", "商品名称"))count = 0for g in ilt:count = count + 1print(tplt.format(count, g[0], g[1]))def main():goods = '书包 'depth = 2start_url = 'https://s.taobao.com/search?q=' + goods#https://s.taobao.com/search?q=infoList = []for i in range(depth):try:url = start_url + '&s=' + str(44*i)html = getHTMLText(url)parsePage(infoList, html)except:continueprintGoodsList(infoList)main()

###三、如何获取cookie
1.确保当前页面是在淘宝网首页

2.获取cookie与headers,依次点击浏览器右上方三横

2021-11-16爬取淘宝商品信息时如何获取cookie相关推荐

  1. Python爬取淘宝商品信息保存到Excel

    前言 本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理. PS:如有需要Python学习资料的小伙伴可以加点击下方链接自行获取 python免费学习资 ...

  2. 利用Selenium爬取淘宝商品信息

    文章来源:公众号-智能化IT系统. 一.  Selenium和PhantomJS介绍 Selenium是一个用于Web应用程序测试的工具,Selenium直接运行在浏览器中,就像真正的用户在操作一样. ...

  3. python+scrapy简单爬取淘宝商品信息

    python结合scrapy爬取淘宝商品信息 一.功能说明: 已实现功能: 通过scrapy接入selenium获取淘宝关键字搜索内容下的商品信息. 待扩展功能: 爬取商品中的全部其他商品信息. 二. ...

  4. 爬取淘宝商品信息selenium+pyquery+mongodb

    ''' 爬取淘宝商品信息,通过selenium获得渲染后的源码,pyquery解析,mongodb存储 '''from selenium import webdriver from selenium. ...

  5. python爬虫——用selenium爬取淘宝商品信息

    python爬虫--用selenium爬取淘宝商品信息 1.附上效果图 2.淘宝网址https://www.taobao.com/ 3.先写好头部 browser = webdriver.Chrome ...

  6. 使用python爬取淘宝商品信息

    使用python爬虫爬取淘宝商品信息 使用的模块主要有 selenium ,time , re, from selenium import webdriver import time import c ...

  7. python淘宝爬虫_python爬虫爬取淘宝商品信息

    本文实例为大家分享了python爬取淘宝商品的具体代码,供大家参考,具体内容如下 import requests as req import re def getHTMLText(url): try: ...

  8. 江湖小白之一起学Python (五)爬取淘宝商品信息

    趁热需打铁,随着这几天的鸡血澎湃,我们来实现一下爬取淘宝商品信息,我记得几年前曾用python写了下抓取淘宝天猫,京东,拍拍的爬虫,专门采集商品信息,图片,评论及评论图片,我还用pyqt开发了个客户端 ...

  9. 爬虫学习笔记——Selenium爬取淘宝商品信息并保存

    在使用selenium来模拟浏览器操作,抓取淘宝商品信息前,先完成一些准备工作. 准备工作:需要安装selenium,pyquery,以及Chrome浏览器并配置ChromeDriver. 安装sel ...

最新文章

  1. android 中自定义安装,AndroidStudio 自定义配置
  2. poj3422(最小费用流 + 拆点)
  3. 多细胞生命进击之路:单细胞为何放弃自由,长成复杂的多细胞?
  4. Java Web项目--使用JSP生成一个页面
  5. (--3198)2: Redirecting From A File( Piping and redirecting output
  6. ArcGIS 10.7拆分多部件要素(Multipart Features)至单部件要素的两种方法
  7. LeetCode 457. 环形数组循环(暴力+快慢指针)
  8. 用Java编辑实现warshall算法_warshall算法 java实现
  9. GNOME下也是Alt+F2,输入gnome-terminal
  10. Redis 3.2.x版本 redis.conf 的配置文件参数详解
  11. Java和C++的对照
  12. 华为面试题(笔试,8分钟写出代码)
  13. 使用igvtools可视化测序深度分布
  14. 在线APP设计平台,APP在线开发工具有哪些?
  15. 程序媛的2013总结以及2014展望
  16. Android Pixel手机Notification小图标显示白方块问题
  17. PyTorch中 nn.Conv2d与nn.ConvTranspose2d函数的用法
  18. PatterNodes for Mac(创建图形矢量模式工具)
  19. 项目进阶攻略:如何快速扩大项目规模
  20. Java关键词去重,关键词优化难易分析_SEO优化难度分析 - 站长工具

热门文章

  1. 2022QS世界大学排名:全球全日制MBA、商科硕士榜单公布
  2. Gitkraken收费问题解决
  3. Hadoop HA (四) --------- YARN-HA 配置
  4. 【CIKM 2021】推荐系统相关论文分类
  5. win7安装office2013过程中出现 office 15 click-to-run extensibility component提示
  6. (算法练习)——小白鼠排队
  7. Oracle 、SQL多字段分组统计
  8. 内存按字节 (Byte)编址,地址从A0000H到DFFFFH,共有多少个字节呢?
  9. 【Theano】安装教程
  10. Win10任务栏全透明化(TranslucentTB)