使用Python保存网站上的图片。
测试网站是豆瓣电影上的海报网址
使用以下code成功的建立了一个文件夹,并且在其中
保存该页面上的17张海报图片(仅保存海报图片,其他图片不保存)。

使用`Python`保存网站上的图片。
测试网站是豆瓣电影上的海报网址
使用以下code成功的建立了一个文件夹,并且在其中
保存该页面上的17张海报图片(仅保存海报图片,其他图片不保存)。from urllib import request
import osdef url_open(url):req = request.Request(url)response = request.urlopen(url)html = response.read()return htmldef find_imgs(url):              #构造一个函数,返回一个存储了若干图片地址的列表html = url_open(url).decode('utf-8') #使用decode('utf-8') 建立一个str对象img_addrs = []                  #img_addrs是一个储存图片地址的列表a = html.find('img src=') #寻找图片地址的起始位置,如果没有找到find()会返回-1while a != -1:                  #将页面上所有海报图片全部提取b = html.find('.jpg',a, a+100) #从a-a+100区间,寻找图片地址的末尾位置,if b != -1:c = html[a+9:b+4]       #c就是在html中截取到的图片地址if 'view' in c:      #进行一步筛选,只想保留海报图片,不需要其他图片print(c)            #打印出图片地址img_addrs.append(c)   #将图片地址添加到列表中else:                       #没有找到合适的图片地址怎么办?b = a + 100             #接着找a = html.find('img src=',b)return img_addrsdef save_imgs(folder,img_addrs): #构造一个函数能够保存图片os.mkdir(folder)         #建立文件夹os.chdir(folder)         #跳转到该文件夹 进行之后文件的写入for each in img_addrs: #依次写入图片。并采用图片地址最后一个小节 作为文件名filename = each.split("/")[-1]with open(filename,'wb')as f:img = url_open(each)f.write(img)def download_jpg():folder = 'D:/eclmn/tobeD' #设定的保存位置,以及目标网址url = "https://movie.douban.com/subject/6390825/photos?type=R&start=0&sortby=like&size=a&subtype=o"img_addrs = find_imgs(url)  #调用find_imgs()函数print("共保存 %d 张图片"% len(img_addrs)) #打印图片数量save_imgs(folder,img_addrs) #调用save_imgs() 函数if __name__ == '__main__':  download_jpg()

显示的结果:

https://img3.doubanio.com/view/photo/m/public/p2512123434.jpg
https://img1.doubanio.com/view/photo/m/public/p2502233869.jpg
https://img3.doubanio.com/view/photo/m/public/p2462191333.jpg
https://img3.doubanio.com/view/photo/m/public/p2512869662.jpg
https://img3.doubanio.com/view/photo/m/public/p2511515914.jpg
https://img3.doubanio.com/view/photo/m/public/p2506117181.jpg
https://img3.doubanio.com/view/photo/m/public/p2511801982.jpg
https://img3.doubanio.com/view/photo/m/public/p2511586591.jpg
https://img3.doubanio.com/view/photo/m/public/p2506401176.jpg
https://img3.doubanio.com/view/photo/m/public/p2512208685.jpg
https://img3.doubanio.com/view/photo/m/public/p2512202212.jpg
https://img3.doubanio.com/view/photo/m/public/p2511585613.jpg
https://img3.doubanio.com/view/photo/m/public/p2508851750.jpg
https://img3.doubanio.com/view/photo/m/public/p2507079945.jpg
https://img3.doubanio.com/view/photo/m/public/p2502610863.jpg
https://img3.doubanio.com/view/photo/m/public/p2502225690.jpg
https://img1.doubanio.com/view/photo/m/public/p2493795748.jpg
共保存 17 张图片

可以使用正则表达式进行匹配。在import re之后 输入下面两句就会在html中查找符合条件的字符串,并以列表的形式存储。

p=r'<img src="([^"]+/.jpg)"
img_list=re.findall(p,html)
from urllib import request
import osdef url_open(url):req=request.Request(url)req.add_header('***')response = request.urlopen(url)html = response.read()return htmldef get_page(url):html= url_open(url).decode('utf-8)a = html.find('current-comment-page') +23b = html.find(']',a)return html[a:b]def find_imgs(url):html = url_open(url).decode('utf-8')img_addrs = []a = html.find('img src=')while a != -1:b = html.find('.jpg',a,a+100)if b != -1:img_addrs.append(html[a+9:b+4])else:b = a + 9a = html.find('img src=',b)return img_addrsdef save_imgs(folder, img_addrs):for each in img_addrs:filename = each.split('/')[-1]with open(filename, 'wb') as f:img = url_open(each)f.write(img)def download_jpg(folder='D:/eclmn/tobeD', pages=10):os.chdir(folder)url = 'http://jandan.net/ooxx'page_num = int(get_page(url))for i in range(pages):page_num -= 1page_url = url + 'page-' + str(page_num) +'#comments'img_addrs = find_imgs(page_url)save_imgs(folder,img_addrs)if __name__ = '__main__':download_jpg()

Python 保存 网页上的图片相关推荐

  1. python 存储图片_使用python存储网页上的图片实例

    使用python存储网页上的图片实例 本文介绍在已知网络图片的地址下,存储图片到本地 本文例子随便选择LOFTER上一张图片,复制图片的地址,如下图所示 在Python中输入代码 import req ...

  2. python下载网页上的文件_用Python下载一个网页保存为本地的HTML文件实例

    Python打开网页并另存为静态html怎么实现 如何用python把网页上的文本内容保存下来那一世的长情,谱一首长相思,冷了多少凄凉,漫了多少青丝,化作多少烟雨,吹散多少世间情!徒悲,奈何,这一世, ...

  3. python 下载网页文件_『如何用python把网页上的文本内容保存下来』python爬取网页内容教程...

    python爬虫:如何爬网页数据并将其放在文本 用requests库 r=r.requests.get(url) r.concent 保存到文件里就行了 如何用python把网页上的文本内容保存下来 ...

  4. python爬虫网页中的图片_Python爬虫爬取一个网页上的图片地址实例代码

    本文实例主要是实现爬取一个网页上的图片地址,具体如下. 读取一个网页的源代码: import urllib.request def getHtml(url): html=urllib.request. ...

  5. 用python爬取动态网页上的图片(百度图片)

    用python爬取动态网页上的图片(百度图片) 参考B站一个视频,视频链接: https://www.bilibili.com/video/BV1Va4y1Y7fK?share_source=copy ...

  6. 如何抓取各种网页上的图片

    1.普通网页图片,如何抓取 要抓取普通网页上的图片,可以使用Python编写代码.以下是一个示例代码片段,可以帮助你了解如何开始编写此类代码: ```python import requests fr ...

  7. python 爬网站上的图片

    最近在做bot的动物识别,最后根据大会给出来的测试数据,发现对简笔画的动物识别处于懵圈状态,识别效果很差~故我需要自己爬取一些简笔画的图片~ 手写学习了某一网站的图片爬取: 附上代码: # -*- c ...

  8. 抓取网页上的图片(一)

    抓取网页上的图片 思路:网页(HTML)中的图片通常在img标签中,图片的链接通常在标签的src属性中,通过BeautifulSoup解析HTML,找到所有的img标签,获取每一个标签中的src的属性 ...

  9. 博客社会学图——使用python检索网页上的友情链接

    <博客社会学图--使用python检索网页上的友情链接>,作者:leniy,原文链接:http://www.cnblogs.com/leniy/archive/2012/11/27/pyt ...

最新文章

  1. Linux监控平台介绍、zabbix监控介绍、安装zabbix、忘记Admin密码如何做
  2. mac git安装及github配置
  3. 网站优化之交换友情链接应注意什么?
  4. 云原生中间件与开源自建TCO对比
  5. 晒晒今年淘宝网买的李宁鞋子
  6. 虚拟机vmware的连接方式以及IP端口,协议等概念
  7. (pytorch-深度学习系列)pytorch实现线性回归
  8. linux 修改ldap密码,Linux-ldap密码修改程序,如何加密ssha
  9. java第一季_Java入门第一季
  10. 了解普通人的心理,在销售中非常重要
  11. PHP与JSP的比较
  12. mysql增量备份脚本
  13. JQuery之事件冒泡
  14. 调试过程中需要使用的工具
  15. Junit 4 与Junit 5区别
  16. 香港手机号正则表达式
  17. 为什么Java的lambda或匿名内部类中用到的外部局部变量需要声明成final或是effectively final的?
  18. python新闻文本爬虫_python学习_新闻联播文字版爬虫(V 1.0版)
  19. 如何删除Facebook评论
  20. Excel中的三种平均值算法

热门文章

  1. 浪潮不能进bios解决过程
  2. 终于鸿蒙微内核弄懂了-程序员和鼓励师的合作
  3. (附源码)计算机毕业设计SSM疫情下小区网格化管理系统
  4. 扣丁软件测试基础知识,苹果无线充电线圈揭秘,iphone8无线充电线圈介绍
  5. League-X:深度学习+英雄联盟,英雄联盟小地图识别器,标定对面打野位置
  6. 新特性:TabLayout动态添加条目
  7. [Go实战]CGO 入门系列-手把手教程4 调用 libevent (c语言类库)为案例
  8. 二元函数偏导数公式_多元函数的偏导数、方向导数、梯度以及微分之间的关系思考...
  9. SCSI总线和协议以及SAN存储网络详解
  10. PHP登入网站抓取并且抓取数据