import timeimport jsonimport requestsimport xlrdimport randomimport os
from xlutils.copy import copy  #导入模块excel = r'C:\Users\Administrator\Desktop\查排名.xls' try:    rdx = xlrd.open_workbook(excel, formatting_info=True)   #打开Excel,并保留原格式except:    print( "no excel in %s " % excel )newb = copy(rdx)   #复制一份做输出#sh = rdx.sheet_by_index(name)print('\033[31;1m已录入型号 :\033[0m',(rdx.sheet_names()))   #所有sheets.name#sh=rdx.sheet_names()for sheet_n in rdx.sheet_names():  #循环整个工作簿    sh1=rdx.sheet_by_name(sheet_n)   #工作表对象    w_sheet=newb.get_sheet(sheet_n)      #获取sheet名称查    id=str(int(sh1.cell_value(0,1)))  #int浮点转整数   str转字符串    print('id' ,sh1.cell_value(0,1),    id ,type(id))    print('\033[31;1m查询型号 :\033[0m'+ sheet_n)    tplt = "{:3}\t{:23}"    #这里控制输出 行数    for i in range(sh1.nrows):   #非空行行数    整个型号的词循环        i1=str(sh1.cell_value(i, 0))        if i1=="":              #空行退出            break        time.sleep(random.uniform(1.5,3.6))   #随机浮点数        url='https://s.m.taobao.com/search?q='+i1+'&sst=1&n=20&buying=buyitnow&m=api4h5&token4h5=&abtest=3&wlsort=3&page=name'        
#url获取地址1.淘宝手机端链接地址登录s.m.taobao.com2.输入查询的关键字 审查元素 这里记得刷新一次3.network  右侧name 一个个打开 需要的信息就在preview里面4.恭喜找到自己需要的信息


       # url='https://s.m.taobao.com/search?q='+i1+'&sst=2&n=40&buying=buyitnow&m=api4h5&abtest=22&wlsort=22&page=name'        #这里是找到目标真正的地址

        headers={'User-Agent':'Mozilla/5.0 (Windows NT 6.name; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/55.0.2883.87 Safari/537.36'}        comments = requests.get(url,headers=headers)

        #这里有问题临时处理办法        try:            js = json.loads(comments.text)

        except json.decoder.JSONDecodeError:            continue

        count=0        for j in js['listItem']:   #所有店铺信息            count+=1            if j['item_id']==id:    #如果id相同                print('j]',j['item_id']==id)                w_sheet.write(i,2,count)                break        else :          #  print(tplt.format('没找到',i1))            w_sheet.write(i,2,'没找到')    w_sheet.write(i+1,2,time.strftime('%m-%d  ',time.gmtime()))    print("        任务完成!")os.remove(r'C:\Users\Administrator\Desktop\查排名.xls')newb.save(r'C:\Users\Administrator\Desktop\查排名.xls')

print('\033[32;1m查询完成!\033[0m','\n','warning:以上是查询无线两页45位结果!')

ps:记得Excel 不要有多于空白工作表 不然会报错

转载于:https://www.cnblogs.com/sunny666/p/9958875.html

python爬取淘宝排名相关推荐

  1. python 爬取淘宝网课

    python爬取淘宝网课,打开web控制台,发现有个链接可以下载到对应的内容,下载的格式是m3u8,用文本打开里面是许多.ts链接,当然百度后得知可以直接下个vlc然后下载,但是还是想用python试 ...

  2. python爬取淘宝商品图片

    python爬取淘宝商品的图片 话不多说,直接上代码: from selenium import webdriver from selenium.webdriver.common import key ...

  3. Python爬取淘宝女模特信息

    前言 Python爬取淘宝美女信息下载本地并同时存储mysql数据库,存储数据库用到了pymysql模块,sql语句简单好用,直接上代码,源码请点链接Python-Spiders文集. 项目结构: 本 ...

  4. python爬淘宝app数据_一篇文章教会你用Python爬取淘宝评论数据(写在记事本)

    [一.项目简介] 本文主要目标是采集淘宝的评价,找出客户所需要的功能.统计客户评价上面夸哪个功能多,比如防水,容量大,好看等等. [二.项目准备工作] 准备Pycharm,下载安装等,可以参考这篇文章 ...

  5. 用Python爬取淘宝网商品信息

    用Python爬取淘宝网商品信息 转载请注明出处 网购时经常会用到淘宝网 点我去淘宝但淘宝网上的商品琳琅满目,于是我参照中国大学 MOOC的代码写了一个爬取淘宝网商品信息的程序 代码如下: impor ...

  6. python电商数据挖掘_利用Python爬取淘宝商品并数据挖掘与分析实战!此乃大型项目!...

    项目内容 本案例选择>> 商品类目:沙发: 数量:共100页 4400个商品: 筛选条件:天猫.销量从高到低.价格500元以上. 项目目的 1. 对商品标题进行文本分析 词云可视化 2. ...

  7. 第一篇博客,python爬取淘宝信息

    python爬取淘宝信息 本人只是刚学python的菜鸟,代码不规范及需改进的地方请指教 我们直接看代码吧!哈哈 import requests from bs4 import BeautifulSo ...

  8. python爬取淘宝商品做数据挖掘

    作业要求:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/3159 项目内容: 本项目选择 淘宝商品类目:零食 数量:一共100页,44 ...

  9. 用Python爬取淘宝2000款套套,我发现了一个重要秘密

    点击上方"码农突围",马上关注,每天早上8:50准时推送 真爱,请置顶或星标 一.淘宝商品信息爬取 这篇文章主要是讲解如何爬取数据,数据的分析放在下一篇.之所以分开是因为爬取淘宝遇 ...

最新文章

  1. HybridDB · 源码分析 · MemoryContext 内存管理和内存异常分析
  2. 放射科医生选择AI供应商的10大标准
  3. 20151130语法基础
  4. Linux文件权限符号含义
  5. harmonyos 2.0怎么升级,HarmonyOS 2.0正式发布 分布式能力获得全面升级
  6. 食品新消费的2021:站在逻辑跑通与成为品牌的隧道期
  7. html5泵站,基于 HTML5 WebGL 的污水处理厂泵站自控系统
  8. 自己动手实现STL 02:构造析构的基本工具construct()和destroy()(stl_construct.h)
  9. python线程池的使用
  10. 【BZOJ3294】放棋子(动态规划,容斥,组合数学)
  11. YouTube视频数据分析报告
  12. Perl脚本 — 数字IC验证
  13. 替换一个文件的字符串
  14. 设计模式之禅-抽象工厂模式
  15. 简单阅读golang的net/http包和Negroni的源码
  16. bootstrap 检验 法 原理_Stata:刀切法/留一法/Jackknife 简介
  17. php 413,PHPCMS上传错误413?
  18. Numpy库及ndarrary基础知识
  19. ifconfig 命令详解
  20. 广东中山电信DNS地址 (铁通/网通)

热门文章

  1. Mysql Shell 8.0 简介
  2. Ext4.1.0 Doc中文版 V1.0.0 Beta
  3. 运放电路正负反馈判断方法--瞬时极性法
  4. 一键多值的Map~~
  5. 医疗影像与模态缺失数据
  6. 【华为】MPLS及MPLS VPN概念
  7. 饿了么UI时间选择器
  8. 【负荷预测】基于灰色预测算法的负荷预测(Python代码实现)
  9. SAP 教程之 SAP 中的 IDOC
  10. 国标GB/T28181协议EasyGBS历史录像回放有多路视频流时,如何单独对某路流进行控制操作?