素材网上的图片下载要VIP? 不存在的。。。

话不多说 5分钟全部搞定,赶紧开始吧!

1.注意到第一页是“0-1.html”,第二页是“0-2.html”,由此可找到规律。

2.查看缩略图片的URL,使用F12开发者工具,通过element选项卡中的工具对网页div进行不断展开,找到图片真正的地址:

例如:

3.查看高清图的URL:进入图片详情界面,直接右键点击图片查看图片地址,如:

比较缩略图与高清图的URL对应关系,即可得出结论,高清图URL=至“.jpg!”的缩略图URL+“一陀代码”

4.编写代码:

import urllib.request
import re
import urllib.error
for i in range(1,10):pageurl="网页链接+str(i)+".html"data=urllib.request.urlopen(pageurl).read().decode("utf-8","ignore")pat='</div></div><img src="(.*?)qt'imglist=re.compile(pat).findall(data)for j in range(0,len(imglist)):try:thisimg=imglist[j]+"/fw/1024/watermark/url/L2ltYWdlcy93YXRlcm1hcmsvZGF0dS5wbmc=/repeat/true/crop/0x1024a0a0"#被网站强行裁剪的一小部分#thisimg=imglist[j]+"/fw/1024/watermark/url/L2ltYWdlcy93YXRlcm1hcmsvZGF0dS5wbmc=/repeat/true/crop/0x1024a0a1024"file="F:/result/"+str(i)+str(j)+".jpg"urllib.request.urlretrieve(thisimg,filename=file)print("第"+str(i)+"页第"+str(j)+"个图片爬取成功")except urllib.error.URLError as e:if hasattr(e,"code"):print(e.code)if hasattr(e,"reason"):print(e.reason)except Exception as e:print(e)

提示:代码可以左右拖动!

遇到的问题:

1)千图网需登录才能看到高清大图的URL。

2)千图网为对高清大图进行了裁剪,可能分为了多个小部分图片。

3)查看网页源代码的缩略图URL与Python爬取的URL可能会不一致,具体原因可能是因为登录导致的。

结果:

好啦!一个非常简单的爬取素材就搞定咯!

你学会了吗?

素材网下载图片要 VIP ? 不存在的相关推荐

  1. Scrapy框架下载图片(站酷网下载图片)

    Scrapy框架下载图片 下载图片 Scrapy框架下载文件(包括图片有自己一套解决方案,比我们直接使用urlretriever更加有优势) 避免重新下载最近下载过的文件 可以方便的指定文件存储路径 ...

  2. 爬取素材网的妹子图片

    这几天心血来潮想研究研究一下scrapy,想测试下其在linux下爬取的速度,于是选取了妹子网来练手(之前爬过),但是获取的链接的竟然在解析下载图片时出现错误,于是换了一个素材网站! 话不多说,贴上代 ...

  3. 17素材网免费下载方法,不用会员,免费超简单方法!

    发现一个超级简单下载17素材网的下载的方法,在这里分享一下. 1.首先你要知道你下载的URL地址 2.复制要下载素材的URL地址到 下面的解析框内 3.点击解析按钮,就可以下载了. 4.分享一下该解析 ...

  4. 素材资源下载网站源码及虚拟商品交易文章发布官网 织梦模板

    介绍: 2021素材资源下载及虚拟商品交易文章发布官网模板网站源码.内有安装说明,还是懂织梦的人下载,不懂的可以问人. 网盘下载地址: https://zijiewangpan.com/XYFiEzy ...

  5. (附源码)php图片素材网 毕业设计110907

    目 录 第1章 前 言 1 1.1 研究背景 1 1.2 研究现状 1 1.3 系统开发目标 2 第2章 技术与原理 3 2.1 Thinkphp框架介绍: 3 2.2 B/S体系工作原理: 3 2. ...

  6. AUI素材网-网站模板源码下载

    AUI素材网 (哎呦哎AIUI) 是一家提供网页模板下载.手机模板网站下载.微信小程序页面下载.app内嵌页面下载.以企业官网.个人网站.社区论坛.后台网站.个人博客.商城购物网站.专题模板等html ...

  7. 教你怎么不办会员也可以下载17素材网的源文件

    17素材网是一家很牛逼的网站,里面有很多的效果是很炫酷的,奈何他是要钱的,我之前一直想要用里面的效果,所以就一直是花钱买的会员,哎,提起来都是眼泪,既然让我花钱,我这种是连吃饭的钱都想用洗碗来抵消的人 ...

  8. 用scrapy+selenium + phantomjs 爬取vip网页,保存为json格式,写入到mysql数据库,下载图片(二)

    接上一编 weipin.py文件的代码 : # -*- coding: utf-8 -*- import scrapy from weipinhui.items import WeipinhuiIte ...

  9. python-scapy爬取mooc网保存在数据库中并下载图片

    爬取的步骤 - 确定url地址; - 获取页面信息;(urllib, requests); - 解析页面提取需要的数据: (正则表达式, bs4, xpath) - 保存到本地(csv, json, ...

最新文章

  1. 【机器学习】多项式回归原理介绍
  2. 程序员生活智慧集——卓越程序员密码
  3. tensorflow gpu利用率为0_训练效率低?GPU利用率上不去?快来看看别人家的tricks吧...
  4. php 插入数据 不成功,thinkphp5连接oracle用insert插入数据失败
  5. 网上商城—管理员删除商品
  6. @requestbody 接受int参数_C++之指针作为函数参数
  7. Android 向右滑返回,退出当前activity
  8. Git仓库迁移,包括所有的分支、标签、日志
  9. 领导者的资质——学习笔记(1)
  10. torch.Tensor和torch.tensor有什么区别?
  11. windows phone 8.0 的网络图片异步加载方案
  12. html 高度塌陷,CSS之高度塌陷问题解决方案
  13. Machine Learning 资讯 : 经济学家谈人工智能
  14. PSP伊苏VS空之轨迹 游戏ISO文件和完美通关全要素存档
  15. 如何延缓衰老?十大抗衰小妙招!
  16. 学校计算机采购清单表,附表:采购清单明细表.doc
  17. Rename_suffix
  18. 四川2021年高考成绩位次查询,2021年填报志愿数据:四川所有本科大学近三年分数线、对应位次排行榜...
  19. 养乐多老师2017版韩语发音教程学习笔记
  20. ddr2代内存最大升级到多少_DDR2台式内存条单条最大多少G?

热门文章

  1. 从零开始制作一个飞机大战类型的射击游戏
  2. Java多线程 信号量和屏障实现控制并发线程数量,主线程等待所有线程执行完毕2
  3. 卸载 kubernetes
  4. 计算机应用研究是北大核心吗,计算机应用研究 CSCD核心期刊北大核心期刊统计源期刊...
  5. PyCharm配置SSH和SFTP连接远程服务器
  6. 微信小程序【常见面试题】
  7. 电容触摸按键原理和实现
  8. 全国一半人跑长沙,长沙一半人跑哪?
  9. EasyCVR通过进程启动无报错,但是自动退出该如何解决?
  10. docker 清理磁盘