目的:通过模拟web请求,抓取web页面,筛选出我们想要的数据。
一.获取完整页面代码并输出
使用python的urllib库来完成

import urllib
def getHtml(url):
page = urllib.urlopen(url)
html = page.read()
return html
html = getHtml("http://www.baidu.com")
print html

运行结果

二.筛选图片
抓取网站为:
http://image.baidu.com/search/index?tn=baiduimage&ipn=r&ct=201326592&cl=2&lm=-1&st=-1&fm=result&fr=&sf=1&fmq=1478187608516_R&pv=&ic=0&nc=1&z=&se=1&showtab=0&fb=0&width=&height=&face=0&istype=2&ie=utf-8&word=橘梨纱
的图片
查看网页源码 发现图片格式为这样


编写如下代码

import re
import urllib
def getHtml(url):
page = urllib.urlopen(url)
html = page.read()
return html
def getImg(html):
reg = r'"objURL":"(.*?)"'
imgre = re.compile(reg)
imglist = re.findall(imgre,html)
return imglist
html=getHtml("http://image.baidu.com/search/index?tn=baiduimage&ipn=r&ct=201326592&cl=2&lm=-1&st=-1&fm=result&fr=&sf=1&fmq=1478187608516_R&pv=&ic=0&nc=1&z=&se=1&showtab=0&fb=0&width=&height=&face=0&istype=2&ie=utf-8&word=橘梨纱")
print getImg(html)

成功输出结果

先完成输出url啦 后面再下载图片保存到本地。

python爬虫抓取橘梨纱照片相关推荐

  1. python爬取大众点评评论_python爬虫抓取数据 小试Python——爬虫抓取大众点评上的数据 - 电脑常识 - 服务器之家...

    python爬虫抓取数据 小试Python--爬虫抓取大众点评上的数据 发布时间:2017-04-07

  2. python爬虫招聘-Python爬虫抓取智联招聘(基础版)

    原标题:Python爬虫抓取智联招聘(基础版) 作者:C与Python实战 「若你有原创文章想与大家分享,欢迎投稿.」 对于每个上班族来说,总要经历几次换工作,如何在网上挑到心仪的工作?如何提前为心仪 ...

  3. Python学习教程:Python爬虫抓取技术的门道

    Python学习教程:Python爬虫抓取技术的门道 web是一个开放的平台,这也奠定了web从90年代初诞生直至今日将近30年来蓬勃的发展.然而,正所谓成也萧何败也萧何,开放的特性.搜索引擎以及简单 ...

  4. 编写Python爬虫抓取豆瓣电影TOP100及用户头像的方法

    这篇文章主要介绍了编写Python爬虫抓取豆瓣电影TOP100及用户头像的方法,用到了Python的urllib和urllib2模块,需要的朋友可以参考下 抓取豆瓣电影TOP100 一.分析豆瓣top ...

  5. 如何用python爬股票数据_python爬虫股票数据,如何用python 爬虫抓取金融数据

    Q1:如何用python 爬虫抓取金融数据 获取数据是数据分析中必不可少的一部分,而网络爬虫是是获取数据的一个重要渠道之一.鉴于此,我拾起了Python这把利器,开启了网络爬虫之路. 本篇使用的版本为 ...

  6. Python爬虫抓取某音乐网站MP3(下载歌曲、存入Sqlite)

    Python爬虫抓取某音乐网站MP3(下载歌曲.存入Sqlite) 最近右胳膊受伤,打了石膏在家休息.为了实现之前的想法,就用左手打字.写代码,查资料完成了这个资源小爬虫.网页爬虫, 最主要的是协议分 ...

  7. python爬虫app步骤_Python爬虫抓取手机APP的传输数据,python爬虫抓取app

    Python爬虫抓取手机APP的传输数据,python爬虫抓取app 大多数APP里面返回的是json格式数据,或者一堆加密过的数据 .这里以超级课程表APP为例,抓取超级课程表里用户发的话题. 1. ...

  8. Python爬虫抓取考试试题

    Python爬虫抓取考试试题 今天做了个小玩意,但觉得挺有意思的,分享给大家.主要是这样的,因为帮妹子寻找考试资料,发现同一本书不同的章节分别在不同的链接中,复制起来实在要命,所以就在想能不能用爬虫实 ...

  9. Python爬虫抓取东方财富网股票数据并实现MySQL数据库存储(转)

    Python爬虫可以说是好玩又好用了.现想利用Python爬取网页股票数据保存到本地csv数据文件中,同时想把股票数据保存到MySQL数据库中.需求有了,剩下的就是实现了. 在开始之前,保证已经安装好 ...

最新文章

  1. linux lftp lftpget 命令简介
  2. Linux下MySql数据库常用操作
  3. 如何使得WIN7下用VS2010做出的MFC程序具有XP风格(摆脱传统界面的效果)
  4. SAP CRM的Genil层和Hybris的jalo模型
  5. 一名IT经理是如何把项目带崩的。。。
  6. [转]HDFS用户指南(中文版)
  7. 随机样本一致性:一种用于图像分析和自动制图的模型拟合模型(4)--(计算透视中心的三维位置)
  8. LeetCode 56. 合并区间(合并区间+排序)
  9. 十进制转换为任意进制及操作符重载
  10. PHP 错误与异常 笔记与总结(1)错误(Deprecated,Notice,Warning)
  11. [Matlab科学绘图] Matlab画图常用函数和命令
  12. ​LeetCode刷题实战248:中心对称数III
  13. Vue+ele 列表不同页列表序号累加
  14. llvm如何使用vc编译器_使用LLVM框架创建可用的编译器,第1部分
  15. 2.OSGI企业应用开发-Eclipse中搭建Felix运行环境
  16. 红孩儿编辑器的模块设计文档目录
  17. android卡通头像,Q版卡通头像设计
  18. userAgent判断客户端,以及各个浏览器的ua
  19. 红米2 手机root
  20. Java 公历转农历,然后农历减一年(或者几天或者任意天),再把这个日期转成公历...

热门文章

  1. 从海量数据中找出中位数
  2. 封海外,封UDP是什么意思,主要作用是什么
  3. 利用反函数求导定理求解四个反函数的导数_20160409
  4. makefile编译
  5. 通过backblaze b2云存储加cloudflare免费cdn回流,白嫖10G不限流免费图床
  6. python中值滤波器_python中值滤波
  7. 今晚,为阿里巴巴打call
  8. 打错一个字母瘫痪半个互联网!亚马逊 S3 宕机事件缘由
  9. 阿里云视频AI全能力解读
  10. HOUDINI 鱼群