python 使用正则表达式爬取淘宝店铺图片

找到网址源码，抓包url 分析正则
#导入模块

import re
import urllib.request
import random

#设置代理代理池随机选取
def open_url(url):
req = urllib.request.Request(url)
req.add_header(“User-Agent”,“Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/66.0.3359.139 Safari/537.36”)

proxy_list = [
{"http":'222.188.178.42:9999'},
{"http":'163.204.243.186:9999'},
{"http":'36.99.215.29:9999'},
{"http":'120.24.173.214:80'},
{"http":'112.85.165.40:9999'},
{"http":'171.80.2.137:9999'},
{"http":'113.128.30.247:808'},

]
proxy = random.choice(proxy_list)
proxy_suopport = urllib.request.ProxyHandler(proxy)
opener = urllib.request.build_opener(proxy_suopport)
urllib.request.install_opener(opener)
res = opener.open(req)
html = res.read().decode(“utf-8”)

return html

def get_img(html):
p = ‘https://img.alicdn.com/imgextra/i4.*?jpg_260x260.jpg’
imglist = re.findall(p,html)

#for i in imglist:
#print(i)for each in imglist:filename = each.split("/")[-1]urllib.request.urlretrieve(each,filename,None)

if name == “main”:
url = “https://re.taobao.com/search_ou?keyword=夏季女装&catid=&refpid=mm_26632258_3504122_32538762&_input_charset=utf8&clk1=ed0c7d3f4b4060c7b9bb6e834b2ce444&spm=a2e15.8261149.07626516005.5.567e29b4qSfXMC”

get_img(open_url(url))

python 使用正则表达式爬取淘宝店铺图片相关推荐

python爬虫淘宝实例-Python——爬虫实战爬取淘宝店铺内所有宝贝图片
之前用四篇很啰嗦的入门级别的文章,带着大家一起去了解并学习在编写爬虫的过程中,最基本的几个库的用法. 那么今天,我们就正式开始我们的第一篇实战内容,爬取一整个淘宝店铺里的所有宝贝的详情页,并且把详情页 ...
python+scrapy简单爬取淘宝商品信息
python结合scrapy爬取淘宝商品信息一.功能说明: 已实现功能: 通过scrapy接入selenium获取淘宝关键字搜索内容下的商品信息. 待扩展功能: 爬取商品中的全部其他商品信息. 二. ...
python + selenium多进程爬取淘宝搜索页数据
python + selenium多进程爬取淘宝搜索页数据 1. 功能描述按照给定的关键词,在淘宝搜索对应的产品,然后爬取搜索结果中产品的信息,包括:标题,价格,销量,产地等信息,存入mongodb ...
python不登陆爬取淘宝数据_python登录并爬取淘宝信息代码示例
本文主要分享关于python登录并爬取淘宝信息的相关代码,还是挺不错的,大家可以了解下. #!/usr/bin/env python # -*- coding:utf-8 -*- from selen ...
爬取淘宝商品图片(仅用于技术交流)
爬取淘宝商品图片(仅用于技术交流) 主要用的是selenium自动化工具 #! /usr/bin/env python # -*-.coding: utf-8 -*- # __author__ = ' ...
python爬取淘宝淘女郎图片
网上有许多爬取淘宝淘女郎的代码,发现有的都不可用,就自己改写了一个,当前可用日期为2017.07.30 前提 chromedriver.exe(本文用的是2.30,有两种使用方式,一种是直接绝对路径引 ...
python爬取淘宝商品图片
python爬取淘宝商品的图片话不多说,直接上代码: from selenium import webdriver from selenium.webdriver.common import key ...
python使用requests爬取淘宝搜索页数据
前一段时间负责爬取淘宝的一些商品信息,本来接到爬取淘宝的任务的时候,下意识的就想用selenium(毕竟淘宝有点不好搞).但是使用selenium时搜索页面也得需要登录,并且当使用selenium时不 ...
使用selenium爬取淘宝店铺信息
使用selenium +PhantomJS()/Chrome爬取淘宝页面,存储到mongdb中使用config进行一些设置 MONGO_URL = 'localhost' MONGO_DB = ' ...

python 使用正则表达式爬取淘宝店铺图片

python 使用正则表达式爬取淘宝店铺图片相关推荐

最新文章

热门文章