利用爬虫爬取wallhaven壁纸
利用爬虫爬取wallhaven壁纸
'''解析网页'''
headers={'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/87.0.4280.66 Safari/537.36 Edg/87.0.664.41'}
response=requests.get('https://wallhaven.cc/toplist',headers=headers)
html=response.text
# print(html)'''解析图片'''
urls=re.findall('<img alt=".*?" class=".*?" data-src="(.*?)" src="" >',html)
Link=[]
for url in urls:# -----预览图链接-----# print(url)if url.find('lg/') !=-1:str=url.split('lg/')[-1]elif url.find('lg/') ==-1:str=url.split('small/')[-1]# -----高清图链接-----# print(str)str1=str[3:]str2=str[0:3]# print(str1)# print(str2)baseurl='https://w.wallhaven.cc/full/'+str2+'wallhaven-'+str1Link.append(baseurl)
# print(Link)'''保存图片'''
# 建立文件夹
dir_name='Wallhaven'
flag=1
if not os.path.exists(dir_name):os.mkdir(dir_name)
for url in Link:flag=flag+1filename=url.split('/')[-1]response=requests.get(url,headers=headers)with open(dir_name+'/'+filename,'wb')as f:f.write(response.content)print(f'图片{flag}已经下载好...')
运行如下图:
利用爬虫爬取wallhaven壁纸相关推荐
- Python爬虫-爬取wallhaven壁纸
Python爬虫-爬取wallhaven壁纸 前言 可行性分析 功能介绍 效果展示 基本思路 1.获取每页(1页24张)壁纸的url 2.获取每张壁纸缩略图的url 3.获取壁纸原图下载的url 4. ...
- Java爬虫爬取wallhaven的图片
Java爬虫爬取wallhaven的图片 参考文章:JAVA Jsoup爬取网页图片下载到本地 需要的jar包:jsuop wallhaven网站拒绝java程序访问,所以要伪装报头. 发送请求时 C ...
- Python爬取wallhaven壁纸 2023.1.31
Python爬取wallhaven壁纸 壁纸页面 前言 源码 壁纸页面 前言 学习中,未加多线程,由于网站.图片大小等因素导致下载缓慢 望各位大神提出建议并加以修善 网站主页及其爬取页如下,可自行修改 ...
- 利用Python爬取必应壁纸
前言 一个喜欢折腾的人,长期看到桌面只有一种壁纸,就想着自己从网上爬取一些壁纸,存下来,随机切换壁纸. 本文仅供学习交流. 工具 Python3 + requests + re Fiddler 抓包工 ...
- python爬虫爬取网页壁纸图片(《底特律:变人》)
参考文章:https://www.cnblogs.com/franklv/p/6829387.html 爬虫爬取网址:http://www.gamersky.com/news/201804/10396 ...
- 基于Jsoup的Java爬虫-爬取必应壁纸网站的壁纸(Java静态壁纸爬虫实例)
准备阶段 1.必应壁纸网站:https://bing.ioliu.cn(爬取对象网站) 2.Jsoup包下载地址:https://jsoup.org/download(以下代码需要用到该包,记得导入包 ...
- 用python爬虫爬取网页壁纸图片(彼岸桌面网唯美图片)
参考文章:https://www.cnblogs.com/franklv/p/6829387.html 今天想给我的电脑里面多加点壁纸,但是嫌弃一个个保存太慢,于是想着写个爬虫直接批量爬取,因为爬虫只 ...
- python定向爬取wallhaven壁纸
首先,大神自觉绕道.... 以下正文 最近刚学python,突然想做个爬取壁纸的小demo 我这里爬取的是wallpaper上的一些图片,网址如下 https://alpha.wallhaven.cc ...
- python实践3——利用爬虫爬取“广州各大行业微信群二维码信息”及存入数据到MySQL数据库
本次以"广州各大行业微信群二维码信息"为例,利用爬虫进行信息"爬取",并存入数据库,方便后面数据分析处理,以及调用.话不多说,直接上代码: [python] v ...
最新文章
- matlab显示的图片,手动保存时四周有白边
- python中文编码正则_python的unicode编码问题(以正则表达式为例)
- thinkcmf 横向排列数据_利用python进行数据分析之数据清洗规整
- foreach循环怎么获取全部返回值_PHP跳出循环的方法语句有哪些
- 【服务器】【个人网盘】宝塔安装NextCloud
- 基于词典和弱标注信息的电影评论情感分析系统
- Mybatis源码详细分析(最新最全)
- 人工智能迅猛发展,如何应对避免失业?
- 初学者学Python必看的几个练手小项目,轻松不枯燥哦
- c++ primer plus6.11第三题 编写一个菜单驱动程序雏形。
- U大师U盘启动盘克隆制作工具
- 知云文献翻译软件及遇到的一些问题
- android开屏页单张图片设置的收评秒开引起的图片变形问题
- 深度学习的员工离职预测
- 洞悉物联网发展1000问之什么物联网技术会颠覆创新呢?
- 【Arduino实验02 LED流水灯】
- 2022全开源企业发卡网源码+修复短网址BUG等
- Brocade-FC交换机–开局
- Python:python镜像源管理
- 计算机和计算机思维理论考试试题科目一,科目一丨信息处理与逻辑思维
热门文章
- iview ui框架
- 【实验技术笔记】细胞表型检测之细胞迁移(细胞划痕实验 + transwell实验)
- 互联网摸鱼日报(2023-02-09)
- java.security.cert.Certificate:No subject alternative DNS name matching api.exmail.qq.com found.解决方法
- 光的干涉衍射计算机模拟仿真技术,实验报告之仿真(光的干涉与衍射).doc
- 项目搭建--从基础搭建开始
- 面对项目进度落后问题该如何应对
- harbor使用免费证书配置https
- javascript基础——window对象(screen、history、location、navigator、window对象常用方法、window对象常用事件)
- [Hello World] 素数筛C语言实现及优化