老严要爬某网购网站的商品信息,正好我最近在学python,就一起写了一个简单的爬虫程序。

需求:某网的商品信息,包括商品名,市场价和售价

工具:python2.7.8,urllib2,re

#coding = utf-8import urllib2
import repath = "aaa.txt"
f = open(path, 'w+')for i in range(4980, 4991):print i# get webpage contenturl = "http://*" + str(i) + "*"page = urllib2.urlopen(url).read()# Regular matchingmatchTitle = re.search(r'<dt>(.*?)</dt>', page)matchMarketPrice = re.search(r'<del.*?>(.*?)</del>', page)matchCurrentPrice = re.search(r'<b>(.*?)</b>', page)# save resultif matchTitle and matchMarketPrice and matchCurrentPrice:f.write(matchTitle.group(1) + '\t' + matchMarketPrice.group(1) + '\t' + matchCurrentPrice.group(1) + '\n')
f.close()

  部分结果显示:

欧莱雅奇焕光感粉嫩透亮修颜霜30ml ¥120.00 109.00
欧莱雅复颜洁面乳125ml   ¥130.00 105.00
欧莱雅复颜抗皱紧致滋润眼霜15ml   ¥210.00 179.00
欧莱雅复颜清漾柔肤水175ml ¥160.00 138.00

  

转载于:https://www.cnblogs.com/Rosanna/p/4125508.html

python爬取商品信息相关推荐

  1. Python爬取商品信息(一)

    爬取淘宝网商品的名称,价格,付款人数 完整代码 def getHTML()讲解 def findMS(html)讲解 def download(data)详解 需要改进的地方 步骤一:提交商品搜索请求 ...

  2. Python爬取商品信息,包括标题、店铺、价格、评论数量、好评数、差评数、好评率

    Python爬取电商商品信息,包括标题.店铺.价格.评论数量.好评数.差评数.好评率 对电商商城数据的爬取主要是评论数量的爬取,标题.店铺.价格等字段可以直接获取网页源码然后通过etree进行解析,但 ...

  3. python爬取商品信息_python爬取商品信息

    原博文 2014-11-27 02:09 − 老严要爬某网购网站的商品信息,正好我最近在学python,就一起写了一个简单的爬虫程序. 需求:某网的商品信息,包括商品名,市场价和售价 工具:pytho ...

  4. python商品会员打折_双十一商品优惠打折,用Python爬取商品信息分析发现这里套路真深...

    咱们今天就以京东笔记本电脑为例分析一下 首先咱们针对京东商城笔记本的网页进行分析,这回只要在网页源码上分析,就可以获取笔记本价格.标题.评论数.商家名称.商家性质. 想要学习Python.关注小编,私 ...

  5. python爬取商品信息_Python基于BeautifulSoup爬取京东商品信息

    今天小编利用美丽的汤来为大家演示一下如何实现京东商品信息的精准匹配~~ HTML文件其实就是由一组尖括号构成的标签组织起来的,每一对尖括号形式一个标签,标签之间存在上下关系,形成标签树:因此可以说Be ...

  6. 苏宁易购网址爬虫爬取商品信息及图片

    利用scrapy来爬取苏宁官网上任何商品的信息,主要的信息有商品标题.商品现价.商品原价.商铺名称,以及用scrapy的ImagesPipeline来下载商品图片. 部分主函数代码如下: # -*- ...

  7. Python 爬取网页信息并保存到本地爬虫爬取网页第一步【简单易懂,注释超级全,代码可以直接运行】

    Python 爬取网页信息并保存到本地[简单易懂,代码可以直接运行] 功能:给出一个关键词,根据关键词爬取程序,这是爬虫爬取网页的第一步 步骤: 1.确定url 2.确定请求头 3.发送请求 4.写入 ...

  8. python爬取机票信息

    python爬取机票信息 飞机和高铁列车不同,在同样的航线中有着不同的票价,借此我们希望获取尽量多的机票信息来分析机票的变化规律. 首先我们选取京东机票为爬取对象http://jipiao.jd.co ...

  9. python爬取控制台信息_python爬虫实战之爬取智联职位信息和博客文章信息

    1.python爬取招聘信息 简单爬取智联招聘职位信息 # !/usr/bin/env python # -*-coding:utf-8-*- """ @Author  ...

  10. Python爬取售房信息并保存至CSV文件

    Python爬取售房信息并保存至CSV文件 在上一篇文章: Python爬取租房信息并保存至Excel文件,介绍了如何使用Python爬取租房信息并保存至Excel文件,在本案例中则是使用Python ...

最新文章

  1. Habana Labs
  2. 书山有径——走进清华大学图书馆
  3. ML之xgboost:利用xgboost算法(sklearn+7CrVa)训练mushroom蘑菇数据集(22+1,6513+1611)来预测蘑菇是否毒性(二分类预测)
  4. spring 的IoC的个人理解
  5. google设置在新标签页打开的方法
  6. 小米网抢购系统开发实践和我的个人观察
  7. iptables二之防火墙SNAT源地址转换,MASQUERADE地址伪装之DNAT目标地址转换讲解和实验演示...
  8. Js基础知识梳理系列
  9. 谷歌发布android+8.2,谷歌Pixel 2代三款新机齐曝光:骁龙835+Android 8.0
  10. ext3 tree tbar 初始化定义
  11. php字符串反转函数_PHP | 反转给定的字符串而不使用库函数
  12. css清除浮动的集中方法
  13. linux系统下卸载rpm方式安装的mysql5.7.*
  14. 数资 | 已知现期量如何求出增长量?
  15. 完全卸载迈克菲Mcafee的工具
  16. 计算机怎么取消账户密码怎么设置,电脑开机密码怎么设置以及取消
  17. 计算机上没有保存任何数据源,Excel数据表找不到链接莫着急——三点操作重建数据的源文件-查看源文件...
  18. 汇编(三):DEBUG
  19. uc视频解析去水印原理分析及源码,集齐四大参数,兑换UC视频播放地址
  20. 手把手推导APM的 sqrt_controller控制器

热门文章

  1. python二维图自动保存_Autodesk Inventor工程图自动保存PDF文件iLogic代码
  2. 【2020牛客寒假基础算法训练营】第二场总结
  3. Oracle asm aix盘,AIX添加ASM的裸盘,存储底层硬盘迁移
  4. redis 加载mysql_Mysql Redis PostgreSQL数据库查看客户端连接
  5. 澳洲计算机博士怎么样,留学美国的一位计算机博士的感悟
  6. linux centos 光盘修复,CentOS的lib库误操作和修复
  7. 完成该操作所需的数据还不可使用_面试官:如何保障数据库和redis缓存的一致性...
  8. 自动驾驶 10-2: 惯性测量单元 (IMU)The Inertial Measurement Unit (IMU)
  9. 算法:回溯十二 Word Search字符串匹配二维矩阵
  10. linux build bash,Win10 Build 14316启用Linux Bash 环境图文教程