python爬取淘宝排名
import timeimport jsonimport requestsimport xlrdimport randomimport os
from xlutils.copy import copy #导入模块excel = r'C:\Users\Administrator\Desktop\查排名.xls' try: rdx = xlrd.open_workbook(excel, formatting_info=True) #打开Excel,并保留原格式except: print( "no excel in %s " % excel )newb = copy(rdx) #复制一份做输出#sh = rdx.sheet_by_index(name)print('\033[31;1m已录入型号 :\033[0m',(rdx.sheet_names())) #所有sheets.name#sh=rdx.sheet_names()for sheet_n in rdx.sheet_names(): #循环整个工作簿 sh1=rdx.sheet_by_name(sheet_n) #工作表对象 w_sheet=newb.get_sheet(sheet_n) #获取sheet名称查 id=str(int(sh1.cell_value(0,1))) #int浮点转整数 str转字符串 print('id' ,sh1.cell_value(0,1), id ,type(id)) print('\033[31;1m查询型号 :\033[0m'+ sheet_n) tplt = "{:3}\t{:23}" #这里控制输出 行数 for i in range(sh1.nrows): #非空行行数 整个型号的词循环 i1=str(sh1.cell_value(i, 0)) if i1=="": #空行退出 break time.sleep(random.uniform(1.5,3.6)) #随机浮点数 url='https://s.m.taobao.com/search?q='+i1+'&sst=1&n=20&buying=buyitnow&m=api4h5&token4h5=&abtest=3&wlsort=3&page=name'
#url获取地址1.淘宝手机端链接地址登录s.m.taobao.com2.输入查询的关键字 审查元素 这里记得刷新一次3.network 右侧name 一个个打开 需要的信息就在preview里面4.恭喜找到自己需要的信息
# url='https://s.m.taobao.com/search?q='+i1+'&sst=2&n=40&buying=buyitnow&m=api4h5&abtest=22&wlsort=22&page=name' #这里是找到目标真正的地址 headers={'User-Agent':'Mozilla/5.0 (Windows NT 6.name; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/55.0.2883.87 Safari/537.36'} comments = requests.get(url,headers=headers) #这里有问题临时处理办法 try: js = json.loads(comments.text) except json.decoder.JSONDecodeError: continue count=0 for j in js['listItem']: #所有店铺信息 count+=1 if j['item_id']==id: #如果id相同 print('j]',j['item_id']==id) w_sheet.write(i,2,count) break else : # print(tplt.format('没找到',i1)) w_sheet.write(i,2,'没找到') w_sheet.write(i+1,2,time.strftime('%m-%d ',time.gmtime())) print(" 任务完成!")os.remove(r'C:\Users\Administrator\Desktop\查排名.xls')newb.save(r'C:\Users\Administrator\Desktop\查排名.xls') print('\033[32;1m查询完成!\033[0m','\n','warning:以上是查询无线两页45位结果!') ps:记得Excel 不要有多于空白工作表 不然会报错
转载于:https://www.cnblogs.com/sunny666/p/9958875.html
python爬取淘宝排名相关推荐
- python 爬取淘宝网课
python爬取淘宝网课,打开web控制台,发现有个链接可以下载到对应的内容,下载的格式是m3u8,用文本打开里面是许多.ts链接,当然百度后得知可以直接下个vlc然后下载,但是还是想用python试 ...
- python爬取淘宝商品图片
python爬取淘宝商品的图片 话不多说,直接上代码: from selenium import webdriver from selenium.webdriver.common import key ...
- Python爬取淘宝女模特信息
前言 Python爬取淘宝美女信息下载本地并同时存储mysql数据库,存储数据库用到了pymysql模块,sql语句简单好用,直接上代码,源码请点链接Python-Spiders文集. 项目结构: 本 ...
- python爬淘宝app数据_一篇文章教会你用Python爬取淘宝评论数据(写在记事本)
[一.项目简介] 本文主要目标是采集淘宝的评价,找出客户所需要的功能.统计客户评价上面夸哪个功能多,比如防水,容量大,好看等等. [二.项目准备工作] 准备Pycharm,下载安装等,可以参考这篇文章 ...
- 用Python爬取淘宝网商品信息
用Python爬取淘宝网商品信息 转载请注明出处 网购时经常会用到淘宝网 点我去淘宝但淘宝网上的商品琳琅满目,于是我参照中国大学 MOOC的代码写了一个爬取淘宝网商品信息的程序 代码如下: impor ...
- python电商数据挖掘_利用Python爬取淘宝商品并数据挖掘与分析实战!此乃大型项目!...
项目内容 本案例选择>> 商品类目:沙发: 数量:共100页 4400个商品: 筛选条件:天猫.销量从高到低.价格500元以上. 项目目的 1. 对商品标题进行文本分析 词云可视化 2. ...
- 第一篇博客,python爬取淘宝信息
python爬取淘宝信息 本人只是刚学python的菜鸟,代码不规范及需改进的地方请指教 我们直接看代码吧!哈哈 import requests from bs4 import BeautifulSo ...
- python爬取淘宝商品做数据挖掘
作业要求:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/3159 项目内容: 本项目选择 淘宝商品类目:零食 数量:一共100页,44 ...
- 用Python爬取淘宝2000款套套,我发现了一个重要秘密
点击上方"码农突围",马上关注,每天早上8:50准时推送 真爱,请置顶或星标 一.淘宝商品信息爬取 这篇文章主要是讲解如何爬取数据,数据的分析放在下一篇.之所以分开是因为爬取淘宝遇 ...
最新文章
- HybridDB · 源码分析 · MemoryContext 内存管理和内存异常分析
- 放射科医生选择AI供应商的10大标准
- 20151130语法基础
- Linux文件权限符号含义
- harmonyos 2.0怎么升级,HarmonyOS 2.0正式发布 分布式能力获得全面升级
- 食品新消费的2021:站在逻辑跑通与成为品牌的隧道期
- html5泵站,基于 HTML5 WebGL 的污水处理厂泵站自控系统
- 自己动手实现STL 02:构造析构的基本工具construct()和destroy()(stl_construct.h)
- python线程池的使用
- 【BZOJ3294】放棋子(动态规划,容斥,组合数学)
- YouTube视频数据分析报告
- Perl脚本 — 数字IC验证
- 替换一个文件的字符串
- 设计模式之禅-抽象工厂模式
- 简单阅读golang的net/http包和Negroni的源码
- bootstrap 检验 法 原理_Stata:刀切法/留一法/Jackknife 简介
- php 413,PHPCMS上传错误413?
- Numpy库及ndarrary基础知识
- ifconfig 命令详解
- 广东中山电信DNS地址 (铁通/网通)