关于python如何获取网页中所有图片并筛选指定分辨率

17小时36分钟前回答

关于python如何获取网页中所有图片并筛选指定分辨率

压测时,图片太少,想着下载网页中的图片,然后过滤指定分辨率,但网页中指定分辨率的图片太少了(见下)

后使用格式工厂转换图片

import urllib.request # 导入urllib模块

import re # 导入re模块

import os

from PIL import Image

htmlurl = 'http://www.win4000.com/wallpaper_detail_134824_3.html'

downloadpath = 'C:\\Users\\yaowanjun\\Desktop\\img\\'

def getHTML(htmlurl):

req = urllib.request.urlopen(htmlurl)

buf = req.read()

return buf.decode('utf-8')

def downloadImg(buf):

req = r'src="(.+?\.jpg)"' #正则表达式,匹配图片格式

imgreq = re.compile(req) #编译正则表达式

imglist = re.findall(imgreq, buf)

# print(imglist)

x = 0

if not os.path.isdir(downloadpath):#若没有则创建

os.makedirs(downloadpath)

paths = downloadpath

for imgurl in imglist:

f = open(paths + str(x) +'.jpg',"wb") #打开文件

req = urllib.request.urlopen(imgurl)

buf = req.read() #读出文件

f.write(buf)

f.close()

x = x + 1

return imglist

def saveImg():

for filenumber in os.walk(downloadpath):

# print(filenumber[2])

for files in filenumber[2]:

# print(files)

singleimg = Image.open(downloadpath + files)

singleimg.close()

#print(singleimg.size, singleimg.width, singleimg.height)

if singleimg.size == (1920, 1080):

print(singleimg)

else:

os.remove(downloadpath + files)

buf = getHTML(htmlurl)

downloadImg(buf)

saveImg()

执行结果:

指定网页所有图片

不符合指定分辨率的图片删除后

以上这篇python获取网页中所有图片并筛选指定分辨率的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持码农之家。

展开阅读

获取图片所有像素点 html,python获取图片分辨率的方法相关推荐

  1. 【Python+图片切割+图片合并】基于Python的图片批量切割与合并(保持原像素不变,不会出现像素大小不匹配、填充黑边的问题)

    基于Python的图片批量切割与合并(保持原像素不变,不会出现像素大小不匹配.填充黑边的问题) 前言 效果图 1.批量读取文件 2.清空目标目录方法(配合切割图片方法使用) 3.批量切割图片(像素不足 ...

  2. python把图片转化为素描画_python如何将图片转换素描画 python将图片转换素描画代码示例...

    python如何将图片转换素描画?本篇文章小编给大家分享一下python将图片转换素描画代码示例,文章代码介绍的很详细,小编觉得挺不错的,现在分享给大家供大家参考,有需要的小伙伴们可以来看看. 代码如 ...

  3. python将excel转换成图片格式_利用python将图片转换成excel文档格式

    前言 本文主要介绍了关于利用python将图片转换成excel文档的相关内容,分享出来供大家参考学习,下面话不多说了,来一起看看详细的介绍吧. 实现步骤 读取图像,获取图像每个像素点的RGB值: 根据 ...

  4. Python获取磁盘使用信息,python获取GPU信息,python根据进程号获取进程信息,pynvml 获取GPU信息,psutil 获取进程信息,系统信息等

    一.工具:psutil模块 psutil是一个跨平台模块,试用相应方法可以直接获取计算机CPU,内存,磁盘,网络等资源使用情况:可以使用我们学习知识与这模块用来做系统监控,性能分析:如果大家熟悉Lin ...

  5. python 获取硬盘信息_使用python获取电脑的磁盘信息方法

    使用Python获取电脑的磁盘信息需要借助于第三方的模块psutil,这个模块需要自己安装,纯粹的CPython下面不具备这个功能. 在iPython交互界面中进行如下演示: 查看电脑的磁盘分区: I ...

  6. python风格变换图片_巧用python实现图片转换成素描和漫画格式

    [相关学习推荐:python视频教程] 本文实例为大家分享了python实现图片转换成素描和漫画格式的具体代码,供大家参考,具体内容如下 原图 图片转换后的成果 源码# -*- coding: utf ...

  7. python的tkinter插入图片_详解python tkinter 图片插入问题

    通过tkinter.PhotoImage插入GIF, PGM/PPM格式的图片. import tkinter class Gui: def __init__(self): self.gui=tkin ...

  8. cv2 和 matplotlib.pyplot 和 PIL.Image 读取图片方式对比【Python读取图片】

    文章目录 import matplotlib.pyplot as plt 和 cv2 读取图像对比 PIL 和 cv2 读取图片对比 mxnet.image.imread 读取图片 PIL 和 tor ...

  9. python图片顶端_用python进行图片整理

    图片整理的基础是区分拍摄图片和表情包.截图之类的其他图片.在此,我们使用exif信息对拍摄图片和其他图片进行区分. 对exif信息进行一下简单介绍. Exif 可交换图像文件格式(英语:Exchang ...

最新文章

  1. 从无到有-在create-react-app基础上接入react-router、redux-saga
  2. 浅谈JavaScript错误
  3. 编译安装 PHP 扩展 - 含 swoole 扩展安装和升级
  4. 小程序向Java传值,微信小程序 页面传值详解
  5. Android之ndk中JNIENV env->NewStringUTF (*env)->NewStringUTF
  6. 四叶草剧场服务器维修价格,四叶草剧场不合理报酬机制是什么-不合理报酬机制和收益详解-Appfound...
  7. 翻车实录之Nature Medicine新冠单细胞文献|附全代码
  8. 美团面试官:讲清楚MySQL结构体系,立马发offer
  9. linux16.04设置网络,ubuntu16.04之后网络IP配置
  10. Android 裁切踩坑
  11. 使用 easypoi 导出带三级下拉联动的 excel
  12. DNS劫持、流量劫持,HTTP/HTTPS劫持
  13. swf格式视频播放器、免费绿色免安装
  14. 关于sqlldr官方教材上的几个例子ulcase study1-9
  15. uvm基础(2)TLM通信,看这一篇就够了
  16. 【mybatis】学习笔记 1配置 搭建 入门案例
  17. RSA+Base64加密
  18. S5PV210开发之1.0.14------LCD显示器
  19. 使用Veritas Volume Replicator(VVR)对Oracle数据库进行容灾
  20. #2284. 接水果(fruit)

热门文章

  1. 小米手环导出心率_小米手环给卫生纸测出心率?这回真相了
  2. 老mac笔记本更换SSD固态硬盘启动失败的解决办法
  3. 适配器-Adapter
  4. PHP给前端返回一个JSON‘对象’
  5. 《成为乔布斯》- 一个你不熟悉的乔帮主
  6. 达人评测机械革命z3air 、宏碁传奇x和暗影骑士擎选哪个好
  7. PHP面试中提问率最高的知识点
  8. Zabbix配置企业微信群聊机器人告警
  9. PHP面试常见问题(个人整理)
  10. 字符串ip地址和数值ip转换