python3爬虫初探(四)之文件保存
接着上面的写,抓取到网址之后,我们要把图片保存到本地,这里有几种方法都是可以的。
#-----urllib.request.urlretrieve-----
import urllib.requestimgurl = 'http://img.ivsky.com/img/tupian/t/201411/01/xiaohuangren_tupian-007.jpg'#前面获取网址中的一个。 urllib.request.urlretrieve(imgurl, 'F:\\Techonolgoy\\Python\\file\\s.jpg') #这里urlretrieve有两个参数,第一个是图片网址;第二个是文件路径,注意'是\\'。如果不指定路径(s.jpg)即默认保存在当前文件夹下(.py所在文件夹)
#------open.write------
import requestsimgurl = 'http://img.ivsky.com/img/tupian/t/201411/01/xiaohuangren_tupian-007.jpg'
1
|
<em id = "__mceDel" >f = open (<span style = "color: #800000;" > '</span><span style="color: #800000;">s.jpg</span><span style="color: #800000;">' < / span>, <span style = "color: #800000;" > '</span><span style="color: #800000;">wb</span><span style="color: #800000;">' < / span><span>)#这里 open 的两个参数,前者同样是路径,后者是文件的打开模式,这里选择 'wb' 代表以二进制的格式写入<br>< / span><em id = "__mceDel" ><span>imgdata < / span> = <span> requests.get(imgurl).content#这里需要获取图片的二进制源码< / span>< / em>< / em>
|
f.write(imgdata)#写入二进制源码到文件 f.close()#关闭文件,如果没有这一步,则文件不能成功保存到本地。
#------with open-------------
相比open来说,with有一个优点就是不用close(),其写入后自动关闭。
1
2
3
4
5
6
|
import requests
imgurl = 'http://img.ivsky.com/img/tupian/t/201411/01/xiaohuangren_tupian-007.jpg'
imgdata = requests.get(imgurl).content
with open ( 's.jpg' , 'wb' ) as f:
f.write(imgdata)
|
python3爬虫初探(四)之文件保存相关推荐
- python3爬虫初探(五)之从爬取到保存
想一想,还是写个完整的代码,总结一下前面学的吧. import requests import re# 获取网页源码 url = 'http://www.ivsky.com/tupian/xiaohu ...
- python3爬虫初探(六)之EXCEL
在爬取数据之后,数据的保存就成为一个新的问题,一般不太大的的数据存储到EXCEL就可以了.这里介绍一个python的第三方库--xlsxwriter. 这个库的安装就不介绍了,pip就可以,不用FQ. ...
- python3爬虫初探(七)使用MySQL
MySQL是Web世界中使用最广泛的数据库服务器.SQLite的特点是轻量级.可嵌入,但不能承受高并发访问,适合桌面和移动应用.而MySQL是为服务器端设计的数据库,能承受高并发访问,同时占用的内存也 ...
- python3爬虫初探(二)之requests
关于请求网页,不得不提requests这个库,这是爬虫经常用到的一个第三方库,用pip安装即可. requests用法很多,这里只写一些基础的,其他高级功能可参考官方文档. import reques ...
- python3爬虫初探(一)之urllib.request
#----第一把武器-----urllib.request--------- urllib.request是python3自带的库(python3.x版本特有),我们用它来请求网页,并获取网页源码.话 ...
- Python3爬虫批量爬取图片并保存到本地
看新闻的时候忽然发现了一个图片网站,那肯定得爬一下. 网址:https://www.0xu.cn/ 不难发现,qcmn这个路径对应青春美女 右键检查图片地址可见 访问该地址成功访问到了图片 正式开始 ...
- python3爬虫初探(八)requests
几个常见的操作: import requests #from PIL import Image #from io import BytesIO def simple_get(url): res ...
- python3爬虫初探(三)之正则表达式
前面已经写了如何获取网页源码,那么接下来就是该解析网页并提取需要的数据了.这里简单写一下正则表达的用法. 首先,找个要抓取图片的网站,获取源码. import requests import re# ...
- Python3 爬虫学习笔记 C09【数据储存系列 — 文件储存】
Python3 爬虫学习笔记第九章 -- [数据储存系列 - 文件储存] 文章目录 [9.1]TXT 文本存储 [9.1.1]基本示例 [9.1.2]打开方式 [9.2]JSON 文件存储 [9.2. ...
最新文章
- PyTorch 神经网络
- Delphi存取图像完整解决方案
- 连接 insance 到 vlan101 - 每天5分钟玩转 OpenStack(97)
- hadoop命令帮助
- oracle 10g 返回RemoteOperationException: ERROR: Wrong password for user
- 计算机学院 年度工作计划,计算机教研组年度工作计划
- mysql一个事务多个log_MySQL识别一个binlog中的一个事物
- Spring Boot 数据国际化
- 面试官问面向对象特点_最好的面试官有什么共同点?
- Madagascar的自定义浮点型函数--对数函数
- 矩形碰撞检测和圆形碰撞检测。
- mysql mariadb不能启动原因_MySQL(MariaDB)无法启动
- Vue实现副本编辑器
- 罗马音平假字复制_急求Bigbang的日文版bangbangbang的罗马音啊!有日文平假歌词我现在复制下...
- 一文快速了解MaxCompute
- 一个排列是某些对象的有序组合,例如,3124 就是数字 1,2,3,4 的一种可能排列。 如果所有的排列按照数值或者字母序排序,我们称其为一个字典序。 0, 1, 2 的字典排列有:012 021 1
- daemon函数理解及参数使用——daemon后进程退出的原因
- mysql联合索引案例_mysql多个联合索引的案例分析
- BLE_BQB Test_Stable Modulation Characteristics, uncoded data at 1 Ms/s_RF-PHY/TRM/BV-09-C
- 如果编写 if 时不带 else
热门文章
- *(已更新)关于Visual Studio 2019安装时VS installer无法下载文件,进度条为0,显示网络有问题的解决办法
- linux 无法访问docker mysql8_Apple M1芯片不支持Docker?Docker:正在努力适配
- flask创建mysql表_MySQL表不是使用Flask和PyMySQL创建的
- opencore0.6.4_心灵终结3.3.4
- mysql5.6 临时表_MySQL5.6 运用临时表做SQL优化
- opencv轻松入门面向python下载_OpenCV轻松入门:面向Python
- 读取无线手柄数据_《宇宙机器人》×PS5手柄使用体验:登月级进化
- python入门之函数结构函数的参数_python3基础之函数参数类型
- 学业水平考试网登录_2019山东高中学业水平考试报名系统入口http://xysp.sdzk.cn
- linux上离线安装bcp,无法在Linux上安装Pyodbc