# coding=utf-8
import urllib.request
import re
from urllib.request import urlopen, urlretrieve#打开网页,获取网页内容
def url_open(url):headers=("user-agent","Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/49.0.2623.22 Safari/537.36 SE 2.X MetaSr 1.0")opener=urllib.request.build_opener()opener.addheaders=[headers]urllib.request.install_opener(opener)data=urllib.request.urlopen(url).read().decode("utf-8","ignore")return dataif __name__=='__main__':try:#定义要查询的商品关键词
        keywd="女朋友礼物"
        keywords=urllib.request.quote(keywd)#定义要爬取的页数
        num=100
        for i in range(num):url="https://s.taobao.com/search?q="+keywords+"&imgfile=&commend=all&ssid=s5-e&search_type=item&sourceId=tb.index&spm=a21bo.50862.201856-taobao-item.1&ie=utf8&bcoffset=4&ntoffset=4&p4ppushleft=1%2C48&s="+str(i*44)data=url_open(url)#定义各个字段正则匹配规则
            img_pat='"pic_url":"(//.*?)"'
            name_pat='"raw_title":"(.*?)"'
            nick_pat='"nick":"(.*?)"'
            price_pat='"view_price":"(.*?)"'
            fee_pat='"view_fee":"(.*?)"'
            sales_pat='"view_sales":"(.*?)"'
            comment_pat='"comment_count":"(.*?)"'
            city_pat='"item_loc":"(.*?)"'
            #查找满足匹配规则的内容,并存在列表中
            imgL=re.compile(img_pat).findall(data)nameL=re.compile(name_pat).findall(data)nickL=re.compile(nick_pat).findall(data)priceL=re.compile(price_pat).findall(data)feeL=re.compile(fee_pat).findall(data)salesL=re.compile(sales_pat).findall(data)commentL=re.compile(comment_pat).findall(data)cityL=re.compile(city_pat).findall(data)for j in range(len(imgL)):img="http:"+imgL[j]#商品图片链接
                name=nameL[j]#商品名称
                nick=nickL[j]#淘宝店铺名称
                price=priceL[j]#商品价格
                fee=feeL[j]#运费
                sales=salesL[j]#商品付款人数
                comment=commentL[j]#商品评论数,会存在为空值的情况
                if(comment==""):comment=0
                city=cityL[j]#店铺所在城市
                print('正在爬取第'+str(i)+"页,第"+str(j)+"个商品信息...")description=str(price)+"#"+str(sales)+"#"+nick+"#"+nametry:urllib.request.urlretrieve(img,'e://taobao//'+description+".jpg")except Exception as e:print(e)except Exception as e:print(str(e))print("任务完成")

python通过关键字搜索淘宝商品详细信息相关推荐

  1. 淘宝/天猫API:item_search-按关键字搜索淘宝商品

    万邦淘宝/天猫按关键字搜索淘宝商品 API 返回值说明 item_search-按关键字搜索淘宝商品 onebound.taobao.item_search 公共参数 请求地址: https://co ...

  2. 淘宝/天猫API,按关键字搜索淘宝商品API返回值说明

    item_search-按关键字搜索淘宝商品    立即测试 获取Key和secret 公共参数: 名称 类型 必须 描述 key String 是 调用key(必须以GET方式拼接在URL中) se ...

  3. item_search - 按关键字搜索淘宝商品

    item_search - 按关键字搜索淘宝商品 测试网址:注册直接调用 Result Object: --------------------------------------- {"i ...

  4. 淘宝/天猫API:item_search_pro-高级关键字搜索淘宝商品

    万邦淘宝/天猫高级关键字搜索淘宝商品 API 返回值说明 item_search_pro-高级关键字搜索淘宝商品 onebound.taobao.item_search_pro 公共参数 请求地址: ...

  5. 淘宝API 按关键字搜索淘宝商品

    淘宝API_item_search - 按关键字搜索淘宝商品 Result Object: { "items": { "page": "1" ...

  6. 淘宝按关键字搜索淘宝商品 API 参数及返回值说明 翻页展示 含调用示例

    淘宝关键字搜索接口,是复原我们在淘宝购物时,在搜索栏内输入关键字,即可获取到相关商品列表,商品信息齐全,支持翻页展示.同时,传入参数sort可按价格排序,也可筛选响应价格段的商品.商品信息是千人千面的 ...

  7. 【无标题】item_search - 按关键字搜索淘宝商品API接口调用展示

    为了进行电商平台 lazada 的API开发,首先我们需要做下面几件事情. 1)开发者注册一个账号 2)然后为每个 lazada 应用注册一个应用程序键(App Key) . 3)下载 lazada ...

  8. 淘宝/天猫、1688、京东API接口—item_search - 按关键字搜索淘宝商品

    为了进行此平台API的调用,首先我们需要做下面几件事情. 1. 获取一个KEY. 2. 参考API文档里的接入方式和示例. 3.查看测试工具是否有需要的接口,响应实例的返回字段是否符合参数要求. 4. ...

  9. 重要接口关键词搜索——item_search-按关键字搜索淘宝商品

    前往测试接口 一.请求参数 请求参数:q=蓝牙耳机&start_price=0&end_price=0&page=1&cat=0&discount_only=& ...

最新文章

  1. ASP.NET MVC 4 (十一) Bundles和显示模式
  2. Java深拷贝与浅拷贝
  3. VTK:PolyData之DeletePoint
  4. 从零开始实现multipart/form-data数据提交
  5. 1024电商项目的邮箱验证码与图形验证码功能模块
  6. 大数据给教育带来怎样的可能?
  7. 二项分布的期望方差证明_关于二项分布
  8. android中shape资源定义,Android中drawable使用Shape资源
  9. AIdl server端监听client是否掉线
  10. Android : First step – Download and build
  11. 开课吧:怎样才能做软件架构师?
  12. 宝塔linux搭建环境注意事项
  13. dlna和miracast可以共存吗_Airplay、Miracast、DLNA传输原理的底层搭建
  14. 5.0在python中是一个整数常量_python学习之路,基础篇-变量和常量
  15. 博客主之自我介绍(不长,随便瞅瞅)
  16. GJB150.5A-2009军用装备实验室温度冲击环境试验
  17. 涉密计算机检查专业软件,RG涉密信息自检查工具
  18. 【实习之T100开发】帆软报表笔记
  19. 使用Fiddler抓取HTTPS的包(Edge、Google)
  20. SEO关键词之选取策略及具体方法

热门文章

  1. 闲谈swi与ucos-终结
  2. CM-GAN:图像大面积缺失修复,兼顾全局结构和纹理细节
  3. 满足条件的数累加(YZOJ-1066)
  4. PHP把html代码转换成普通字符串,在页面中显示
  5. 可道云kodexplorer搭建私有云后的配置优化
  6. 【转载】风控-风控策略逻辑
  7. 【摄影技术基础】图像处理之图像采集
  8. elasticsearch:使用top_hits聚合获取分组列表
  9. 基于JSP实现的课程资源管理系统网站
  10. [娱乐向]如何使用STM32播放篮球视频