Python爬虫学习(四)爬取图片素材网站素材
效果
目标网站
图片网站
目标接口:
# GET 请求
https://www.logosc.cn/api/so/get?page=0&pageSize=20&keywords=&category=local&isNeedTranslate=undefined
通过分析,我们可以知道应该可以修改page
和pageSize
参数来控制获取的图片。
导入第三方模块
import requests
import os.path
分析要爬取的信息
代码
封装getPicture(page,pageSize)
方法,来爬取图片素材的地址,在通过download(urls)
方法来进行下载!
# author: LiuShihao
# data: 2020/12/3 5:23 下午
# youknow: 各位老铁,我的这套代码曾经有人出价三个亿我没有卖,如今拿出来和大家分享,不求别的,只求大家免费的小红心帮忙点一点,这里谢过了。
# desc: 爬取搜图神器网站的图片素材
"""
https://www.logosc.cn/so/
目标接口: https://www.logosc.cn/api/so/get?page=0&pageSize=20&keywords=&category=local&isNeedTranslate=undefined
"""
import requests
import os.path
# page = 0
# pageSize = 50headers = {"user-agent": "Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/55.0.2883.87 Safari/537.36",
}
# 获取素材地址
def getPicture(page,pageSize):urls = []url = f"https://www.logosc.cn/api/so/get?page={page}&pageSize={pageSize}&keywords=&category=local&isNeedTranslate=undefined"print(url)response = requests.get(url=url, headers=headers)content = response.json()if "data" in content:i = 0while True:try:if content["data"][i]["large_img_path"]["url"]:picture_url = content["data"][i]["large_img_path"]["url"]print("picture_url" + str(i) + ":", picture_url)i = i + 1urls.append(picture_url)except:breakprint("没有数据!")else:print("没有获取到数据!")return urls# 下载素材
def download(urls):i = 0for image in urls:i += 1image = requests.get(image).contentif os.path.exists('images'):with open('images/' + str(i) + '.jpg', 'wb') as f: # 注意打开的是就jpg文件 w 只读 b二进制print(str(i) + '.jpg 正在保存。。。')f.write(image)else:print('目录不存在')if __name__ == '__main__':urls = getPicture(0,40)print(f"获取到{len(urls)}个地址")download(urls)
Python爬虫学习(四)爬取图片素材网站素材相关推荐
- python爬虫学习之爬取某网站上的视频
""" 实现步骤:发送请求 >>> 获取数据 >>> 解析数据 >>> 保存数据 1.发送请求,对于视频信息数据包发 ...
- Python爬虫学习笔记 -- 爬取糗事百科
Python爬虫学习笔记 -- 爬取糗事百科 代码存放地址: https://github.com/xyls2011/python/tree/master/qiushibaike 爬取网址:https ...
- Python爬虫学习之爬取淘宝搜索图片
Python爬虫学习之爬取淘宝搜索图片 准备工作 因为淘宝的反爬机制导致Scrapy不能使用,所以我这里是使用selenium来获取网页信息,并且通过lxml框架来提取信息. selenium.lxm ...
- 爬虫学习,尝试爬取小说网站
初步学习了scrapy 尝试着爬取小说网站全部小说(发现没问题就停了) 以下为scrapy中基础爬虫的写法 # -*- coding: utf-8 -*- import scrapy from scr ...
- python爬虫学习之爬取全国各省市县级城市邮政编码
实例需求:运用python语言在ip查询 查ip 网站ip查询 同ip网站查询 iP反查域名 iP查域名 同ip域名网站爬取全国各个省市县级城市的邮政编码,并且保存在excel文件中 实例环境:pyt ...
- python爬虫学习一--爬取网络小说实例
最近疫情猖獗,长假憋在家里实在无聊,早上突然看了一篇python爬虫文章,当场决定试验一下,参照了一下别人的案例,自己各种踩坑捣鼓了好几个小时,终于成功最后把具体步骤和注意点分享给大家: 1.Pyth ...
- 为了部落 来自艾泽拉斯勇士的python爬虫学习心得 爬取大众点评上的各种美食数据并进行数据分析
为了希尔瓦娜斯 第一个爬虫程序 csgo枪械数据 先上代码 基本思想 问题1 问题2 爬取大众点评 URL分析 第一个难题 生成csv文件以及pandas库 matplotlib.pyplot库 K- ...
- python爬虫学习之爬取超清唯美壁纸
简介 壁纸的选择其实很大程度上能看出电脑主人的内心世界,有的人喜欢风景,有的人喜欢星空,有的人喜欢美女,有的人喜欢动物.然而,终究有一天你已经产生审美疲劳了,但你下定决定要换壁纸的时候,又发现网上的壁 ...
- 杭州python爬虫招聘_python爬取招聘网站(智联,拉钩,Boss直聘)
刚好最近有这需求,动手写了几个 就贴上代码算了 1.智联 将结果保存为python的一个数据框中 import requests from requests.exceptions import Req ...
- python爬虫学习(2) —— 爬一下ZOL壁纸
我喜欢去ZOL找一些动漫壁纸当作桌面,而一张一张保存显然是太慢了. 那怎么办呢,我们尝试使用简单的爬虫来解决这个问题. 0. 本爬虫目标 抓取给定分类「或子分类」网址的内容 分析并得到每个分类下的所有 ...
最新文章
- python 模板引擎 对比_Python Web开发模板引擎优缺点总结
- PHP5.5安装GeoIP扩展
- RocketMQ高性能通信实现机制源码精读
- 任何人都可以胜任全栈开发?
- go中的make和new的区别
- java代码实现读写txt文件(txt文件转换成java文件)
- Problem L. Visual Cube(杭电多校2018年第三场+模拟)
- GitHub客户端使用
- 最新emoji表情代码大全_如何给微信公众号菜单添加emoji(亲测有效)
- 如何给论文添加参考文献
- 冰箱味道很臭?那你真的该学学这些除臭妙招
- 魔众EDM邮件营销系统 v1.1.0 页面SEO优化,系统升级调整
- ubuntu20.04安装并运行ORB_SLAM3(一路顺风版)
- endnote使用方法大全,endnote教程
- Session.Abandon()的用法
- C语言实现入门级小游戏——三子棋
- 弗洛伊德的乌龟和兔子(循环检测
- 软件测试团队口号及队名,团队队名口号(精选50句)
- hyperf使用curl产生的超时问题
- HTML+CSS大作业:购物商城网页设计与实现——手机主题网站
热门文章
- 2021-07-28项目经理日记
- 航模无人机中PWM信号频率浅谈
- 【R】【支持向量机分类方法】
- python趣味入门——写几个常玩的游戏
- 计算机原理【七】之 输入输出系统
- Android 交流分享汇总
- node安装不能正常使用 Error: ENOENT: no such file or directory, mkdir ‘D:\‘
- android 拼音搜索联系人分析与实现(支持多音字,支持T9搜索,支持Qwerty搜索)
- MYSQl 多实例部署
- OpenCV学习笔记(六)之轮廓提取与角度测量