import requests
import re
import timedef getHTMLText(url):try:r = requests.get(url, timeout = 30)#设定超时时间r.raise_for_status()r.encoding = r.apparent_encodingreturn r.textexcept:return print("解析网页失败")
def parsePage(li, html):try:counts = re.findall(r'\"view_price\"\:\"[\d\.]*\"',html)#正则获取价格names = re.findall(r'\"raw_title\"\:\".*?\"',html)#正则获取名字for i in range(len(counts)):price = eval(counts[i].split(':')[1])#以:分割,获取价格,同时删除引号等符号title = eval(names[i].split(':')[1])li.append([price, title])except:print("爬取失败")def printGoodList(lis):tplt = "{:4}\t{:8}\t{:16}"print(tplt.format("序号","价格","产品信息"))num = 1for g in lis:num = num + 1print(tplt.format(num, g[0], g[1]))if __name__ == '__main__':goods = "口红"depth = 3start_url = 'http://s.taobao.com/search?q=' + goodslist = []for i in range(depth):try:url = start_url + '&s=' + str(44*i)html = getHTMLText(url)parsePage(list,html)except:continueprintGoodList(list)

抓取淘宝某类商品名称和价格相关推荐

  1. python3 爬虫实战案例 (抓取淘宝信息)(淘宝加了搜索必须登录的验证,此方法所到的结果都是0)

    需求:对比足球,篮球,乒乓球,羽毛球,网球,相关物品的销售量保存到excle中 和抓取淘宝关键字相关信息的销售量,这和之前抓取csdn网站浏览量取不同,抓取csdn浏览量主要是通过bs4Tag标签,而 ...

  2. 抓取淘宝商品信息并制作商品信息比价表(以口红为例)

    快速抓取淘宝上口红信息 import requests import re import os def getHtmlText(url): try: r=requests.get(url,timeou ...

  3. Python爬虫实战(4):抓取淘宝MM照片

    Python爬虫入门(1):综述 Python爬虫入门(2):爬虫基础了解 Python爬虫入门(3):Urllib库的基本使用 Python爬虫入门(4):Urllib库的高级用法 Python爬虫 ...

  4. scrapy抓取淘宝女郎

    scrapy抓取淘宝女郎 准备工作 首先在淘宝女郎的首页这里查看,当然想要爬取更多的话,当然这里要查看翻页的url,不过这操蛋的地方就是这里的翻页是使用javascript加载的,这个就有点尴尬了,找 ...

  5. Python爬虫实战八之利用Selenium抓取淘宝匿名旺旺

    其实本文的初衷是为了获取淘宝的非匿名旺旺,在淘宝详情页的最下方有相关评论,含有非匿名旺旺号,快一年了淘宝都没有修复这个. 很多人学习python,不知道从何学起. 很多人学习python,掌握了基本语 ...

  6. python爬虫淘宝视频_Python2爬虫:以抓取淘宝MM为例(实战)

    本篇目标 1.抓取淘宝MM的姓名,头像,年龄 2.抓取每一个MM的资料简介以及写真图片 3.把每一个MM的写真图片按照文件夹保存到本地 4.熟悉文件保存的过程 1.URL的格式 在这里我们用到的URL ...

  7. 抓取淘宝天猫的商品的促销价格

    通过商品的url获取促销价,天猫淘宝的促销价并不是直接生成的,而是通过js间接生成的.所以通过jsoup等工具无法抓取. 首先是尝试使用htmlUnit,因为其可以,模拟浏览器运行js.css.经试验 ...

  8. Python爬虫实战:抓取淘宝MM照片

    本篇目标 1.抓取淘宝MM的姓名,头像,年龄 2.抓取每一个MM的资料简介以及写真图片 3.把每一个MM的写真图片按照文件夹保存到本地 4.熟悉文件保存的过程 1.URL的格式 在这里我们用到的URL ...

  9. 抓取淘宝司法拍卖数据

    抓取淘宝司法拍卖数据 之前在某平台看到一些人发布需求,需要爬取淘宝司法拍卖的数据.在这里给大家分享一下,有需要的就直接复制我的代码,粘贴回去就可以直接用了,今天下午才用了的是可以完整的抓取想要的所有数 ...

最新文章

  1. fprintf、printf、sprintf、fscanf、scanf、sscanf 格式化输入输出
  2. 宏基因组实战7. bwa序列比对, samtools查看, bedtools丰度统计
  3. php array_multisort对数据库结果多个字段进行排序
  4. 作业6 分析项目的NABCD和项目的产品Backlog
  5. swift4.0 确定手势滑动方向
  6. python掌握程度怎么判断-想要学习人工智能需要掌握Python到什么程度
  7. python程序开发入门_Python开发入门14天集训营-第一章
  8. 用libevent实现简易的telnet
  9. LOL手游最能混分的英雄,前期刷野靠队友,迪丽阿巴亲自教学
  10. Why is it recommended to create clusters with odd number of nodes? | 为什么集群节点建议奇数个?
  11. mysql bench linux_MySQL Study之--Linux下安装MySQL workbench工具
  12. Oracle使用hs odbc连接mssql2008
  13. 第六节:ES6为字符串String带来哪些好玩的特性?
  14. Linux 下安装nodejs
  15. 面经——算法题数据输入输出
  16. Python Flask微信公众号开发
  17. 怎么看电脑支持多少兆网速_电脑网速怎么看(电脑怎么看网速多少兆)
  18. linux 显示数字权限,Linux数字权限解释
  19. GalaxyOJ-636 (概率DP)
  20. python 课后作业_python 学习笔记 三 课后作业

热门文章

  1. 递推练习之费解的开关
  2. 技术经理成长复盘-我是什么样的人
  3. PBOC规范研究之四、文件结构及访问
  4. amcharts php,AMCHARTS+MYSQL+PHP的使用实例
  5. 【CS229笔记】协方差矩阵概念快速回顾
  6. OI游记——一个不配称为OIer的失败选手的自白
  7. DirectX的发展历程!
  8. writing idiomatic python 读书笔记(2)
  9. c语言做相册影集,制作DIY相册影集教程-如何制作影集
  10. js修改服务器域名,春哥详解:业务域名 JS接口安全域名 网页授权域名