python爬取淘宝商品销量的程序,运行程序,输入想要爬取的商品关键词,在代码中的‘###'可以进一步约束商品的属性,比如某某作者的书籍,可以在###处输入作者名字,以及时期等等。最后可以得到所要商品的总销量

import requests

import bs4

import re

import json

def open(keywords, page):

headers={"User-Agent":"Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/55.0.2883.87 Safari/537.36"}

payload = {'q':keywords, 'sort':"sale-desc", 's':(page-1)*44}

url = "https://s.taobao.com/search"

res = requests.get(url, params = payload)

return res

def get_item(res):

g_page_config = re.search(r'g_page_config = (.*?);\n', res.text)

page_config_json = json.loads(g_page_config.group(1))

page_item = page_config_json['mods']['itemlist']['data']['auctions']

result = []#整理出我们关注的信息(ID,标题,链接,售价,销量和商家)

for each in page_item:

dict1 = dict.fromkeys(('id','title','link','price','sale','shoper'))

dict1['id'] = each['nid']

dict1['title'] = each['title']

dict1['link'] = each['detail_url']

dict1['price'] = each['view_price']

dict1['sale'] = each['view_sales']

dict1['shoper'] = each['nick']

result.append(dict1)

return result

def count_sales(items):

count = 0

for each in items:

if '###' in each['title']:#规定只取标题中‘###'的商品

count += int(re.search(r'\d+',each['sale']).group())

return count

def main():

keywords = input("请输入搜索关键词:")#可以为各种商品名称

length = 10#淘宝商品页数

total = 0

for each in range(length):

res = open(keywords, each+1)

items = get_item(res)

total += count_sales(items)#销售总量

print(total)

if __name__ == "__main__":

main()

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持脚本之家。

python爬淘宝商品销量信息_python爬取淘宝商品销量信息相关推荐

  1. C# 淘宝商品微信返利助手开发-(四)返利助手开发(2)淘宝分享的内容如何只取淘口令

    系列教程一目录:返利助手原理 系列教程二目录:返利助手开放文档以及帐号申请地址 系列教程三目录:返利助手开发(1)API介绍 系列教程四目录:返利助手开发(2)淘宝分享的内容如何只取淘口令 系列教程五 ...

  2. python爬取淘宝商品信息_python爬取淘宝商品信息并加入购物车

    先说一下最终要达到的效果:谷歌浏览器登陆淘宝后,运行python项目,将任意任意淘宝商品的链接传入,并手动选择商品属性,输出其价格与剩余库存,然后选择购买数,自动加入购物车. 在开始爬取淘宝链接之前, ...

  3. python好用的库存尾货女装_Python抓取淘宝女装信息(一)

    本次实战案例以抓取淘宝上连衣裙信息为切入点,共抓取4356件连衣裙产品信息.在此基础上进行初步分析.这里首先感谢@大宇,后期的数据处理与图表制作全靠大神帮助.下面我们进入正式介绍环节. 淘宝.京东.链 ...

  4. python爬取商品信息_python爬取商品信息

    原博文 2014-11-27 02:09 − 老严要爬某网购网站的商品信息,正好我最近在学python,就一起写了一个简单的爬虫程序. 需求:某网的商品信息,包括商品名,市场价和售价 工具:pytho ...

  5. python爬取招聘信息_python 爬取boss直聘招聘信息实现

    原标题:python 爬取boss直聘招聘信息实现 1.一些公共方法的准备 获取数据库链接: importpymysql ''' 遇到不懂的问题?Python学习交流群:821460695满足你的需求 ...

  6. python爬取boss直聘招聘信息_Python 爬取boss直聘招聘信息!

    原标题:Python 爬取boss直聘招聘信息! 1.一些公共方法的准备 获取数据库链接: importpymysql ''' 遇到不懂的问题?Python学习交流群:821460695满足你的需求, ...

  7. python爬取酒店信息_Python 爬取美團酒店信息

    事由:近期和朋友聊天,聊到黃山酒店事情,需要了解一下黃山的酒店情況,然后就想着用python 爬一些數據出來,做個參考 主要思路:通過查找,基本思路清晰,目標明確,僅僅爬取美團莫一地區的酒店信息,不過 ...

  8. python爬虫抓收费图片_简单的抓取淘宝图片的Python爬虫

    写了一个抓taobao图片的爬虫,全是用if,for,while写的,比较简陋,入门作品. 从网页http://mm.taobao.com/json/request_top_list.htm?type ...

  9. python网易云歌词做成词云图_Python爬取李荣浩最短歌曲贝贝的网易云评论并做成词云图...

    前言 在18 年的 10 月 17 号,李荣浩发了一张新专辑「耳朵」,专辑里有一首歌「贝贝」,只有 4 秒,歌词也就两个字.而且这首歌的作曲 .作词 .编曲.制作人.和声.录音师.混音师.录音室.混音 ...

最新文章

  1. 树结构练习——排序二叉树的中序遍历(二叉搜索树)
  2. perl regular expresstion
  3. C++ Strings(字符串)
  4. redis安装(linux)
  5. shiro框架@RequiresPermissions 解释
  6. “约见”面试官系列之常见面试题第二十五篇之对vue-router的理解(建议收藏)
  7. Python+django网页设计入门(10):分页显示
  8. matplotlib画子图subplot
  9. 使用apidoc 生成Restful web Api文档——新手问题与解决方法
  10. 【疑难解决】将设备通过Ehome协议接入EasyCVR,级联后视频无法播放如何解决?
  11. 偏微分方程数值解主要步骤
  12. 6章4节类的声明和对象与方法
  13. 【19调剂】湖南师范大学2019年信息科学与工程学院硕士研究生复试(含调剂)方案...
  14. 公众号快速涨粉方法汇总
  15. 牛顿下山法C++实现
  16. Django适配达梦数据库
  17. 抗肿瘤靶向药物丨小分子化合物 or 单克隆抗体?- MedChemExpress
  18. 记录一次Git解决CONFLICT冲突
  19. 计算机专业学校运动会霸气口号,学校运动会口号霸气押韵
  20. 科研中提高效率的软件网站

热门文章

  1. 深圳市数字经济指数发布:数字经济蓬勃发展,数字用户深度渗透
  2. css3基础知识总结
  3. java 画立体图形
  4. 渗透测试成功的8个关键
  5. 深入探究js中无所不在的this
  6. linux系统如何安装mtk驱动程序,模块编译问题 给MTK芯片的wifi网卡编译linux驱动 系统是mint...
  7. iOS 判断手机型号及系统版本(最新)持续更新
  8. 利用Kalibr标定Camera-IMU外参
  9. 【题解】2020年蓝桥杯C/C++程序设计B组·试题 D: REPEAT 程序
  10. java控制分屏_java实现arcgis地图分屏(双图)