实例:

import re   #导入正则表达式的库
import requests   #导入第三方http库
import os
import shutil
import timehtml = requests.get("http://news.qq.com/photo.shtml")  #通过get方法获取腾讯新闻的网页源代码
html.encoding = 'utf-8'   #编码方式utf-8,用于正常显示中文
#print(html.text)   #显示源码homedir = os.getcwd()   #获取项目当前路径
if os.path.exists(homedir+'\pic'):shutil.rmtree(homedir+'\pic')
else:os.mkdir(homedir+'\pic')   #创建pic文件夹,用于保存图片pic_url = re.findall('img src="(.*?)"',html.text,re.S)   #设定正则表达式,爬取图片的url,匹配任意字符/包括换行符re.S
i = 0
for each in pic_url:   #遍历pic_urlprint('now downloading:' + each)#pic = requests.get("http://news.qq.com/photo.shtml/"+each) #补充完整的网址,通过get方法获取图片pic = requests.get(each)  # 补充完整的网址,通过get方法获取图片fp = open('pic\\' + str(i) + '.png','wb')  #在pic文件夹下创建jpg格式的文件# fp = open('pic\\', 'wb')  # 在pic文件夹下创建jpg格式的文件fp.write(pic.content)  #将图片写入到工程文件夹下的pic文件夹中fp.close()i += 1

结果:

Python 网页爬取图片相关推荐

  1. 【大学生课程实践】实操:使用Python爬虫爬取图片

    实操:使用Python爬虫爬取图片 参考链接: 源码部署 安装源码中的爬虫库 创建 images文件 参考链接: 本博客作为大佬博客学习笔记记录 参考链接:孩子说"你没看过奥特曼" ...

  2. [python爬虫] 爬取图片无法打开或已损坏的简单探讨

    本文主要针对python使用urlretrieve或urlopen下载百度.搜狗.googto(谷歌镜像)等图片时,出现"无法打开图片或已损坏"的问题,作者对它进行简单的探讨.同时 ...

  3. python爬虫爬取图片无法打开_半小时入门python爬虫爬下网站图片,不能再简单了...

    阅读本文大约需要2分钟 本文旨在为没有爬虫基础的,偶尔想爬虫爬一下某个网站上的图片的初学者使用,如果你已经是对爬虫很熟悉了,下面依然有你感兴趣的东西. 我最近也才正儿八经学习了下爬虫,出于某种需要爬一 ...

  4. Python爬虫爬取图片

    ** Python爬虫爬取网站指定图片(多个网站综合经验结论分享) ** 我想以这篇文章来记录自己学习过程以及经验感受,因为我也是个初学者.接下来我将分享几个我爬取过的图片网站,给大家们分享下自己的方 ...

  5. python爬虫 爬取图片

    图片 爬取单张图片 #网址:https://pic.netbian.com/ 我们爬取:https://pic.netbian.com/4kmeinv/ from lxml import etree ...

  6. python多线程爬取图片

    2019独角兽企业重金招聘Python工程师标准>>> 创建一个 Queue.Queue() 的实例,然后使用数据对它进行填充. 将经过填充数据的实例传递给线程类,后者是通过继承 t ...

  7. python网页爬取方法_Python爬取网页的三种方法

    # Python爬取网页的三种方法之一:  使用urllib或者urllib2模块的getparam方法 import urllib fopen1 = urllib.urlopen('http://w ...

  8. python如何爬取图片到指定文件夹论文_基于Python的图片爬虫程序设计

    互联网中包含大量有价值的 数据,网络爬虫通过既定规则可 以自动地抓取互联网数据并下载 至本地存储.研究网络爬虫的工 作原理和基于 Python 网络信息爬 取技术模块功能,基于 Requests- B ...

  9. (纯小白)Python简单爬取图片

    在具体介绍图片爬取之前我们先简单弄个小实验,使用Python来写一个下载图片的程序. #完整代码 import requestsdef down_pic(down_url, picname):head ...

  10. python爬虫爬取图片的简单步骤和实现代码

    目录 1. 如何获取网页信息 1). 直接从网络读取 2). 先将网页源码保存到本地,再读取 2. 分析获取到的网页信息,提取需要的信息(图片地址) 3. 使用request将图片保存到本地以及会碰到 ...

最新文章

  1. 轨迹生成--三次样条插值
  2. malloc和free函数详解
  3. 求助:一个物理专业的在做GPU的人
  4. CSDN好多原创翻译的文章
  5. 三星a60android9,三星A6058官方国行安卓9固件rom线刷升级包:CHM-A6058ZMU2BSC9
  6. dateformat java 格式_java Date日期类和SimpleDateFormat日期类格式
  7. 思科 IPSec ***配置2:
  8. Spring5参考指南:IOC容器
  9. Mysql--重点1
  10. c语言ntc程序,NTC热敏电阻测温度 单片机C和汇编源程序
  11. WSL2之kali从C盘迁移到E盘
  12. 开启Mac原生NTFS支持
  13. 【论文解读】MmWave Radar and Vision Fusion for Object Detection in Autonomous Driving: A Review
  14. kafka和flink的动态扩容
  15. 计算机怎么放映文档,如何从Apple TV上的计算机播放视频文件
  16. java毫秒数_Java中的毫秒数
  17. 如何用python做计算_如何用Python做些基本的数学运算
  18. 阿里云智能编码插件,更 Cosy 的开发体验
  19. 内部稽核与内部控制管理体系关系的探讨
  20. JAVA----动态初始化数组的null判断

热门文章

  1. 笔记本电脑WIFI图标消失解决方案大全,无WIFI图标也能自由连WIFI上网。
  2. 系统架构设计师-软件架构设计
  3. 淘宝竞争对手热销词查询 淘宝竞争对手分析
  4. 计算机cpu占用率高,CPU占用率高怎么解决?Win10系统电脑CPU占用率100%的解决方法...
  5. 12306刷票工具(简单易学)
  6. 解决TortoiseSVN不显示状态图标(图文步骤详解)
  7. 南桥和北桥-主板芯片组发展史
  8. 要管理此计算机上的用户账户,Win10安装软件用户账户控制提示管理员已阻止运行此应用解决方法...
  9. Different lower_case_table_names settings for server (‘1‘) and data dictionary (‘0‘) 解决方案
  10. 2022-2028全球与中国汽车空调冷凝器市场现状及未来发展趋势