Python 保存网页上的图片

使用Python保存网站上的图片。
测试网站是豆瓣电影上的海报网址
使用以下code成功的建立了一个文件夹，并且在其中
保存该页面上的17张海报图片（仅保存海报图片，其他图片不保存）。

使用`Python`保存网站上的图片。
测试网站是豆瓣电影上的海报网址
使用以下code成功的建立了一个文件夹，并且在其中
保存该页面上的17张海报图片（仅保存海报图片，其他图片不保存）。from urllib import request
import osdef url_open(url):req = request.Request(url)response = request.urlopen(url)html = response.read()return htmldef find_imgs(url):              #构造一个函数，返回一个存储了若干图片地址的列表html = url_open(url).decode('utf-8') #使用decode('utf-8') 建立一个str对象img_addrs = []                  #img_addrs是一个储存图片地址的列表a = html.find('img src=') #寻找图片地址的起始位置，如果没有找到find()会返回-1while a != -1:                  #将页面上所有海报图片全部提取b = html.find('.jpg',a, a+100) #从a-a+100区间，寻找图片地址的末尾位置，if b != -1:c = html[a+9:b+4]       #c就是在html中截取到的图片地址if 'view' in c:      #进行一步筛选，只想保留海报图片，不需要其他图片print(c)            #打印出图片地址img_addrs.append(c)   #将图片地址添加到列表中else:                       #没有找到合适的图片地址怎么办？b = a + 100             #接着找a = html.find('img src=',b)return img_addrsdef save_imgs(folder,img_addrs): #构造一个函数能够保存图片os.mkdir(folder)         #建立文件夹os.chdir(folder)         #跳转到该文件夹 进行之后文件的写入for each in img_addrs: #依次写入图片。并采用图片地址最后一个小节 作为文件名filename = each.split("/")[-1]with open(filename,'wb')as f:img = url_open(each)f.write(img)def download_jpg():folder = 'D:/eclmn/tobeD' #设定的保存位置，以及目标网址url = "https://movie.douban.com/subject/6390825/photos?type=R&start=0&sortby=like&size=a&subtype=o"img_addrs = find_imgs(url)  #调用find_imgs()函数print("共保存 %d 张图片"% len(img_addrs)) #打印图片数量save_imgs(folder,img_addrs) #调用save_imgs() 函数if __name__ == '__main__':  download_jpg()

显示的结果：

https://img3.doubanio.com/view/photo/m/public/p2512123434.jpg
https://img1.doubanio.com/view/photo/m/public/p2502233869.jpg
https://img3.doubanio.com/view/photo/m/public/p2462191333.jpg
https://img3.doubanio.com/view/photo/m/public/p2512869662.jpg
https://img3.doubanio.com/view/photo/m/public/p2511515914.jpg
https://img3.doubanio.com/view/photo/m/public/p2506117181.jpg
https://img3.doubanio.com/view/photo/m/public/p2511801982.jpg
https://img3.doubanio.com/view/photo/m/public/p2511586591.jpg
https://img3.doubanio.com/view/photo/m/public/p2506401176.jpg
https://img3.doubanio.com/view/photo/m/public/p2512208685.jpg
https://img3.doubanio.com/view/photo/m/public/p2512202212.jpg
https://img3.doubanio.com/view/photo/m/public/p2511585613.jpg
https://img3.doubanio.com/view/photo/m/public/p2508851750.jpg
https://img3.doubanio.com/view/photo/m/public/p2507079945.jpg
https://img3.doubanio.com/view/photo/m/public/p2502610863.jpg
https://img3.doubanio.com/view/photo/m/public/p2502225690.jpg
https://img1.doubanio.com/view/photo/m/public/p2493795748.jpg
共保存 17 张图片

可以使用正则表达式进行匹配。在import re之后输入下面两句就会在html中查找符合条件的字符串，并以列表的形式存储。

p=r'<img src="([^"]+/.jpg)"
img_list=re.findall(p,html)

from urllib import request
import osdef url_open(url):req=request.Request(url)req.add_header('***')response = request.urlopen(url)html = response.read()return htmldef get_page(url):html= url_open(url).decode('utf-8)a = html.find('current-comment-page') +23b = html.find(']',a)return html[a:b]def find_imgs(url):html = url_open(url).decode('utf-8')img_addrs = []a = html.find('img src=')while a != -1:b = html.find('.jpg',a,a+100)if b != -1:img_addrs.append(html[a+9:b+4])else:b = a + 9a = html.find('img src=',b)return img_addrsdef save_imgs(folder, img_addrs):for each in img_addrs:filename = each.split('/')[-1]with open(filename, 'wb') as f:img = url_open(each)f.write(img)def download_jpg(folder='D:/eclmn/tobeD', pages=10):os.chdir(folder)url = 'http://jandan.net/ooxx'page_num = int(get_page(url))for i in range(pages):page_num -= 1page_url = url + 'page-' + str(page_num) +'#comments'img_addrs = find_imgs(page_url)save_imgs(folder,img_addrs)if __name__ = '__main__':download_jpg()

Python 保存网页上的图片相关推荐

python 存储图片_使用python存储网页上的图片实例
使用python存储网页上的图片实例本文介绍在已知网络图片的地址下,存储图片到本地本文例子随便选择LOFTER上一张图片,复制图片的地址,如下图所示在Python中输入代码 import req ...
python下载网页上的文件_用Python下载一个网页保存为本地的HTML文件实例
Python打开网页并另存为静态html怎么实现如何用python把网页上的文本内容保存下来那一世的长情,谱一首长相思,冷了多少凄凉,漫了多少青丝,化作多少烟雨,吹散多少世间情!徒悲,奈何,这一世, ...
python 下载网页文件_『如何用python把网页上的文本内容保存下来』python爬取网页内容教程...
python爬虫:如何爬网页数据并将其放在文本用requests库 r=r.requests.get(url) r.concent 保存到文件里就行了如何用python把网页上的文本内容保存下来 ...
python爬虫网页中的图片_Python爬虫爬取一个网页上的图片地址实例代码
本文实例主要是实现爬取一个网页上的图片地址,具体如下. 读取一个网页的源代码: import urllib.request def getHtml(url): html=urllib.request. ...
用python爬取动态网页上的图片（百度图片）
用python爬取动态网页上的图片(百度图片) 参考B站一个视频,视频链接: https://www.bilibili.com/video/BV1Va4y1Y7fK?share_source=copy ...
如何抓取各种网页上的图片
1.普通网页图片,如何抓取要抓取普通网页上的图片,可以使用Python编写代码.以下是一个示例代码片段,可以帮助你了解如何开始编写此类代码: ```python import requests fr ...
python 爬网站上的图片
最近在做bot的动物识别,最后根据大会给出来的测试数据,发现对简笔画的动物识别处于懵圈状态,识别效果很差~故我需要自己爬取一些简笔画的图片~ 手写学习了某一网站的图片爬取: 附上代码: # -*- c ...
抓取网页上的图片(一)
抓取网页上的图片思路:网页(HTML)中的图片通常在img标签中,图片的链接通常在标签的src属性中,通过BeautifulSoup解析HTML,找到所有的img标签,获取每一个标签中的src的属性 ...
博客社会学图——使用python检索网页上的友情链接
<博客社会学图--使用python检索网页上的友情链接>,作者:leniy,原文链接:http://www.cnblogs.com/leniy/archive/2012/11/27/pyt ...

Python 保存网页上的图片

Python 保存网页上的图片相关推荐

最新文章

热门文章

Python 保存 网页上的图片

Python 保存 网页上的图片相关推荐

最新文章

热门文章

Python 保存网页上的图片

Python 保存网页上的图片相关推荐