利用爬虫爬取wallhaven壁纸

'''解析网页'''
headers={'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/87.0.4280.66 Safari/537.36 Edg/87.0.664.41'}
response=requests.get('https://wallhaven.cc/toplist',headers=headers)
html=response.text
# print(html)'''解析图片'''
urls=re.findall('<img alt=".*?" class=".*?" data-src="(.*?)" src="" >',html)
Link=[]
for url in urls:# -----预览图链接-----# print(url)if url.find('lg/') !=-1:str=url.split('lg/')[-1]elif url.find('lg/') ==-1:str=url.split('small/')[-1]# -----高清图链接-----# print(str)str1=str[3:]str2=str[0:3]# print(str1)# print(str2)baseurl='https://w.wallhaven.cc/full/'+str2+'wallhaven-'+str1Link.append(baseurl)
# print(Link)'''保存图片'''
# 建立文件夹
dir_name='Wallhaven'
flag=1
if not os.path.exists(dir_name):os.mkdir(dir_name)
for url in Link:flag=flag+1filename=url.split('/')[-1]response=requests.get(url,headers=headers)with open(dir_name+'/'+filename,'wb')as f:f.write(response.content)print(f'图片{flag}已经下载好...')

运行如下图:

利用爬虫爬取wallhaven壁纸相关推荐

  1. Python爬虫-爬取wallhaven壁纸

    Python爬虫-爬取wallhaven壁纸 前言 可行性分析 功能介绍 效果展示 基本思路 1.获取每页(1页24张)壁纸的url 2.获取每张壁纸缩略图的url 3.获取壁纸原图下载的url 4. ...

  2. Java爬虫爬取wallhaven的图片

    Java爬虫爬取wallhaven的图片 参考文章:JAVA Jsoup爬取网页图片下载到本地 需要的jar包:jsuop wallhaven网站拒绝java程序访问,所以要伪装报头. 发送请求时 C ...

  3. Python爬取wallhaven壁纸 2023.1.31

    Python爬取wallhaven壁纸 壁纸页面 前言 源码 壁纸页面 前言 学习中,未加多线程,由于网站.图片大小等因素导致下载缓慢 望各位大神提出建议并加以修善 网站主页及其爬取页如下,可自行修改 ...

  4. 利用Python爬取必应壁纸

    前言 一个喜欢折腾的人,长期看到桌面只有一种壁纸,就想着自己从网上爬取一些壁纸,存下来,随机切换壁纸. 本文仅供学习交流. 工具 Python3 + requests + re Fiddler 抓包工 ...

  5. python爬虫爬取网页壁纸图片(《底特律:变人》)

    参考文章:https://www.cnblogs.com/franklv/p/6829387.html 爬虫爬取网址:http://www.gamersky.com/news/201804/10396 ...

  6. 基于Jsoup的Java爬虫-爬取必应壁纸网站的壁纸(Java静态壁纸爬虫实例)

    准备阶段 1.必应壁纸网站:https://bing.ioliu.cn(爬取对象网站) 2.Jsoup包下载地址:https://jsoup.org/download(以下代码需要用到该包,记得导入包 ...

  7. 用python爬虫爬取网页壁纸图片(彼岸桌面网唯美图片)

    参考文章:https://www.cnblogs.com/franklv/p/6829387.html 今天想给我的电脑里面多加点壁纸,但是嫌弃一个个保存太慢,于是想着写个爬虫直接批量爬取,因为爬虫只 ...

  8. python定向爬取wallhaven壁纸

    首先,大神自觉绕道.... 以下正文 最近刚学python,突然想做个爬取壁纸的小demo 我这里爬取的是wallpaper上的一些图片,网址如下 https://alpha.wallhaven.cc ...

  9. python实践3——利用爬虫爬取“广州各大行业微信群二维码信息”及存入数据到MySQL数据库

    本次以"广州各大行业微信群二维码信息"为例,利用爬虫进行信息"爬取",并存入数据库,方便后面数据分析处理,以及调用.话不多说,直接上代码: [python] v ...

最新文章

  1. matlab显示的图片,手动保存时四周有白边
  2. python中文编码正则_python的unicode编码问题(以正则表达式为例)
  3. thinkcmf 横向排列数据_利用python进行数据分析之数据清洗规整
  4. foreach循环怎么获取全部返回值_PHP跳出循环的方法语句有哪些
  5. 【服务器】【个人网盘】宝塔安装NextCloud
  6. 基于词典和弱标注信息的电影评论情感分析系统
  7. Mybatis源码详细分析(最新最全)
  8. 人工智能迅猛发展,如何应对避免失业?
  9. 初学者学Python必看的几个练手小项目,轻松不枯燥哦
  10. c++ primer plus6.11第三题 编写一个菜单驱动程序雏形。
  11. U大师U盘启动盘克隆制作工具
  12. 知云文献翻译软件及遇到的一些问题
  13. android开屏页单张图片设置的收评秒开引起的图片变形问题
  14. 深度学习的员工离职预测
  15. 洞悉物联网发展1000问之什么物联网技术会颠覆创新呢?
  16. 【Arduino实验02 LED流水灯】
  17. 2022全开源企业发卡网源码+修复短网址BUG等
  18. Brocade-FC交换机–开局
  19. Python:python镜像源管理
  20. 计算机和计算机思维理论考试试题科目一,科目一丨信息处理与逻辑思维

热门文章

  1. iview ui框架
  2. 【实验技术笔记】细胞表型检测之细胞迁移(细胞划痕实验 + transwell实验)
  3. 互联网摸鱼日报(2023-02-09)
  4. java.security.cert.Certificate:No subject alternative DNS name matching api.exmail.qq.com found.解决方法
  5. 光的干涉衍射计算机模拟仿真技术,实验报告之仿真(光的干涉与衍射).doc
  6. 项目搭建--从基础搭建开始
  7. 面对项目进度落后问题该如何应对
  8. harbor使用免费证书配置https
  9. javascript基础——window对象(screen、history、location、navigator、window对象常用方法、window对象常用事件)
  10. [Hello World] 素数筛C语言实现及优化