Python 网页爬取图片
实例:
import re #导入正则表达式的库
import requests #导入第三方http库
import os
import shutil
import timehtml = requests.get("http://news.qq.com/photo.shtml") #通过get方法获取腾讯新闻的网页源代码
html.encoding = 'utf-8' #编码方式utf-8,用于正常显示中文
#print(html.text) #显示源码homedir = os.getcwd() #获取项目当前路径
if os.path.exists(homedir+'\pic'):shutil.rmtree(homedir+'\pic')
else:os.mkdir(homedir+'\pic') #创建pic文件夹,用于保存图片pic_url = re.findall('img src="(.*?)"',html.text,re.S) #设定正则表达式,爬取图片的url,匹配任意字符/包括换行符re.S
i = 0
for each in pic_url: #遍历pic_urlprint('now downloading:' + each)#pic = requests.get("http://news.qq.com/photo.shtml/"+each) #补充完整的网址,通过get方法获取图片pic = requests.get(each) # 补充完整的网址,通过get方法获取图片fp = open('pic\\' + str(i) + '.png','wb') #在pic文件夹下创建jpg格式的文件# fp = open('pic\\', 'wb') # 在pic文件夹下创建jpg格式的文件fp.write(pic.content) #将图片写入到工程文件夹下的pic文件夹中fp.close()i += 1
结果:
Python 网页爬取图片相关推荐
- 【大学生课程实践】实操:使用Python爬虫爬取图片
实操:使用Python爬虫爬取图片 参考链接: 源码部署 安装源码中的爬虫库 创建 images文件 参考链接: 本博客作为大佬博客学习笔记记录 参考链接:孩子说"你没看过奥特曼" ...
- [python爬虫] 爬取图片无法打开或已损坏的简单探讨
本文主要针对python使用urlretrieve或urlopen下载百度.搜狗.googto(谷歌镜像)等图片时,出现"无法打开图片或已损坏"的问题,作者对它进行简单的探讨.同时 ...
- python爬虫爬取图片无法打开_半小时入门python爬虫爬下网站图片,不能再简单了...
阅读本文大约需要2分钟 本文旨在为没有爬虫基础的,偶尔想爬虫爬一下某个网站上的图片的初学者使用,如果你已经是对爬虫很熟悉了,下面依然有你感兴趣的东西. 我最近也才正儿八经学习了下爬虫,出于某种需要爬一 ...
- Python爬虫爬取图片
** Python爬虫爬取网站指定图片(多个网站综合经验结论分享) ** 我想以这篇文章来记录自己学习过程以及经验感受,因为我也是个初学者.接下来我将分享几个我爬取过的图片网站,给大家们分享下自己的方 ...
- python爬虫 爬取图片
图片 爬取单张图片 #网址:https://pic.netbian.com/ 我们爬取:https://pic.netbian.com/4kmeinv/ from lxml import etree ...
- python多线程爬取图片
2019独角兽企业重金招聘Python工程师标准>>> 创建一个 Queue.Queue() 的实例,然后使用数据对它进行填充. 将经过填充数据的实例传递给线程类,后者是通过继承 t ...
- python网页爬取方法_Python爬取网页的三种方法
# Python爬取网页的三种方法之一: 使用urllib或者urllib2模块的getparam方法 import urllib fopen1 = urllib.urlopen('http://w ...
- python如何爬取图片到指定文件夹论文_基于Python的图片爬虫程序设计
互联网中包含大量有价值的 数据,网络爬虫通过既定规则可 以自动地抓取互联网数据并下载 至本地存储.研究网络爬虫的工 作原理和基于 Python 网络信息爬 取技术模块功能,基于 Requests- B ...
- (纯小白)Python简单爬取图片
在具体介绍图片爬取之前我们先简单弄个小实验,使用Python来写一个下载图片的程序. #完整代码 import requestsdef down_pic(down_url, picname):head ...
- python爬虫爬取图片的简单步骤和实现代码
目录 1. 如何获取网页信息 1). 直接从网络读取 2). 先将网页源码保存到本地,再读取 2. 分析获取到的网页信息,提取需要的信息(图片地址) 3. 使用request将图片保存到本地以及会碰到 ...
最新文章
- 轨迹生成--三次样条插值
- malloc和free函数详解
- 求助:一个物理专业的在做GPU的人
- CSDN好多原创翻译的文章
- 三星a60android9,三星A6058官方国行安卓9固件rom线刷升级包:CHM-A6058ZMU2BSC9
- dateformat java 格式_java Date日期类和SimpleDateFormat日期类格式
- 思科 IPSec ***配置2:
- Spring5参考指南:IOC容器
- Mysql--重点1
- c语言ntc程序,NTC热敏电阻测温度 单片机C和汇编源程序
- WSL2之kali从C盘迁移到E盘
- 开启Mac原生NTFS支持
- 【论文解读】MmWave Radar and Vision Fusion for Object Detection in Autonomous Driving: A Review
- kafka和flink的动态扩容
- 计算机怎么放映文档,如何从Apple TV上的计算机播放视频文件
- java毫秒数_Java中的毫秒数
- 如何用python做计算_如何用Python做些基本的数学运算
- 阿里云智能编码插件,更 Cosy 的开发体验
- 内部稽核与内部控制管理体系关系的探讨
- JAVA----动态初始化数组的null判断
热门文章
- 笔记本电脑WIFI图标消失解决方案大全,无WIFI图标也能自由连WIFI上网。
- 系统架构设计师-软件架构设计
- 淘宝竞争对手热销词查询 淘宝竞争对手分析
- 计算机cpu占用率高,CPU占用率高怎么解决?Win10系统电脑CPU占用率100%的解决方法...
- 12306刷票工具(简单易学)
- 解决TortoiseSVN不显示状态图标(图文步骤详解)
- 南桥和北桥-主板芯片组发展史
- 要管理此计算机上的用户账户,Win10安装软件用户账户控制提示管理员已阻止运行此应用解决方法...
- Different lower_case_table_names settings for server (‘1‘) and data dictionary (‘0‘) 解决方案
- 2022-2028全球与中国汽车空调冷凝器市场现状及未来发展趋势