#!/usr/bin/python
# -*- coding: UTF-8 -*-
import re
import urllib,urllib2;#通过url获取网页
def getHtml(url):# 要设置请求头,让服务器知道不是机器人
    user_agent = 'Mozilla/4.0 (compatible; MSIE 5.5; Windows NT)'
    headers = {'User-Agent': user_agent}request=urllib2.Request(url,headers=headers);page = urllib2.urlopen(request);html = page.read()return html#通过正则表达式来获取图片地址,并下载到本地
def getImg(html):reg = r'src="(.+?\.jpg)"'
    imgre = re.compile(reg)imglist = imgre.findall(html)x = 0
    for imgurl in imglist:print imgurl;#通过urlretrieve函数把数据下载到本地的D:\\images,所以你需要创建目录
        urllib.urlretrieve(imgurl, 'D:\\images\\%s.jpg' % x)x = x + 1

html = getHtml("http://www.qiushibaike.com/imgrank/")
getImg(html)

python抓取网站的图片并下载到本地相关推荐

  1. 【python】python 爬虫(python抓取网站的图片)

    文章目录 1.什么是爬虫 2.爬虫的思想 一些知识 1 . 环境的搭建请看: 2 . 3 .:Requests urllib的升级版本打包了全部功能并简化了使用方法(点我查看官方文档) 4 : bea ...

  2. python抓取网站图片_python抓取图片示例 python抓取网页上图片

    python抓取网页上图片 这个错误时是什么意思 下面是代码 import re import urllib.request imp正则表达式匹配的url有错误 for x in add: print ...

  3. python抓取网站图片_利用python抓取网站图片

    看了网上关于python抓取网站图片的例子,所以自己也尝试着写一个,但是发现这个网站的src不是标准的路径,需要自己添加前面的目录地址,尝试了几次也不成功,所以希望有经验的朋友指导下. 本人是初学者, ...

  4. 使用python抓取落网期刊图片

    使用python抓取落网期刊图片 虽然使用python开发也将近两年了,但工作中使用python更多处理业务逻辑,数据加工等,难免有些枯燥.乏味.一直听闻python在web数据爬取.数据分析上有无可 ...

  5. python抓取网站乱码_如何使用Python抓取网站

    python抓取网站乱码 by Devanshu Jain 由Devanshu Jain It is that time of the year when the air is filled with ...

  6. python爬取网站源代码+图片

    python爬取网站源代码+图片 需求分析 基础知识 正则表达式 python网络请求 文件读写 实现 基本思路 具体实现 结果 总结 需求分析 大部分有志青年都想建立属于自己的个人网站,从零开始设计 ...

  7. python爬取网站的图片

    python爬取网站的图片 本次爬取图片所需要用到的库:Requests库,BeautifulSoup库,正则表达式,os库. 思路:先爬一张图片,再爬一个网站的图片 先爬一张图片: 首先要得到这张图 ...

  8. VB 抓取网站验证码图片

    VB 抓取网站验证码图片 2010年05月20日 方法一:使用XMLHTTP Public Function GetCheckCode() Dim xmlHttp As Object Dim Pic ...

  9. Java+Jsoup: 爬取二次元妹子图片并下载到本地(完整代码)

    简介 这是一个基于Jsoup的用来爬取网页上图片并下载到本地的Java项目. 完整项目见 https://github.com/AsajuHuishi/CrawlByJsoup exe文件见getIm ...

最新文章

  1. 太真实!当程序员接手了新项目...... | 每日趣闻
  2. Keil 二进制数输入宏
  3. 算法提高课-搜索-DFS之连通性模型-AcWing 1113. 红与黑:dfs和bfs两种做法
  4. Python:非常详细的解释如何判断某个变量的类型以及代码实现
  5. 【解题报告】Leecode 2057. 值相等的最小索引——Leecode周赛系列
  6. python(15)-window7配置iPython
  7. 架构学习----消息队列
  8. C++工程通过opencv找到自己定义的矩形中的两平行线的距离
  9. ATP-EMTP电缆LCC模型中相数与电缆数的设置
  10. LitJson的使用
  11. 传递闭包c语言算法解析,找关系的传递闭包 用c语言编 一个关系的传递闭包
  12. SAE 联合乘云至达与谱尼测试携手共同抗疫
  13. SpringBoot关于文件上传配置的几种方式
  14. AD(altium designer)15原理图与PCB设计教程(六)——印制电路板设计的基础知识
  15. 《离职申请表》交了后 在公司最后一天上班
  16. java生成word,html文件并将内容保存至数据库 (http://blog.163.com/whs3727@126/blog/static/729915772007325112014115/)
  17. 华三c语言笔试,H3C笔试及答案解析
  18. linux下安装mariadb
  19. P1717 Finger guessing
  20. android隐藏系统ui_如何启用Android的“系统UI调谐器”以访问实验功能

热门文章

  1. ES6的变量声明详述
  2. 【最详细】数据结构(C语言版 第2版)第二章课后习题答案 严蔚敏 等 编著
  3. java吧王者_java单排上王者!(一) java内存
  4. html5 canvas图文编辑器源码_5个微信编辑器,再也不用为公众号发愁啦
  5. linux多线程计算pi,使用蒙特卡洛方法多线程计算pi值
  6. php5.5 集成环境,windows下配置php5.5开发环境及开发扩展_PHP
  7. 无头结点单链表的逆置_第1章第2节练习题11 就地逆置单链表
  8. seir模型的微分方程怎么写_抖音文案怎么写?6种热门文案写作模型
  9. python中字符串的制表符为_零基础学python_03_字符串(拼接+换行+制表符)
  10. 编码utf-8的不可映射字符_不要在 MySQL 中使用“utf8”,请使用“utf8mb4”