python 豆瓣爬虫:自动下载周星驰图片
目录
- 效果演示
- 代码
- 效果
- 爬虫流程
- 打开网页
- 获取数据
- 保存数据
效果演示
废话不多说,先看下代码和效果
代码
# coding:utf-8
import requests
import jsondef download(src,id):dir = './'+str(id)+'.jpg'try:pic = requests.get(src,timeout=10)except requests.exceptions.ConnectionError:print('timeout error')fp= open(dir,'wb')#writefp.write(pic.content)#closefp.close()query ='周星驰'
for i in range(0,38958,20):url = 'https://www.douban.com/j/search_photo?q='+query+'&limit=20&start='+str(i)# openhtml = requests.get(url).text# getresponse = json.loads(html,encoding='utf-8')for image in response['images']:print(image['src'])# 测试路径download(image['src'],image['id'])
效果
星爷当年如此帅气
爬虫流程
打开网页
首先打开豆瓣官网,输入关键词‘周星驰’进行搜索,结果出来后,我们选择图片选项,注意选择图片前要打开chrome的开发者工具,然后我们可以活动请求的链接地址了
https://www.douban.com/j/search_photo?q=周星驰&limit=20&start=0
这里有三个参数q,limit,start.q表示搜索的关键词,limit表示每页的显示数量,start表示每页的起始序号,注意默认是从0开始
获取数据
搜索结果是json 结果的数据,具体内容是一个数组images,数组的元素是字典
保存数据
def download(src,id):dir = './'+str(id)+'.jpg'try:pic = requests.get(src,timeout=10)except requests.exceptions.ConnectionError:print('timeout error')fp= open(dir,'wb')#writefp.write(pic.content)#closefp.close()
python 豆瓣爬虫:自动下载周星驰图片相关推荐
- python discuz_Python爬虫自动下载Discuz论坛附件。
121,278 因工作需要,要定期收集卡饭论坛的病毒样本板块的病毒样本,所以就考虑用 Python做个爬虫,然后自动下载附件. 核心功能有3个: 1· 登录 2· 伪造cookie保持session ...
- python网络爬虫快速下载4K高清壁纸
python网络爬虫快速下载4K高清壁纸 此处给出下载壁纸的链接地址彼岸图网,进入网站之后,我们看到可以下载风景,游戏,动漫,美女等类型的4K图片,装逼一下,re库有贪婪匹配,那我们就写一个通用代码来 ...
- python使用requests库下载单张图片的简单示例
python使用requests库下载单张图片的简单示例 简要说明 代码示例 简要说明 下载图片的核心代码如下: res = requests.get(url=img_url, headers=hea ...
- 使用Tkinter + urllib + requests 实现自动下载百度图片
整体步骤分三步: 1.设计tkinter页面布局 2.获取图片链接列表 3.执行下载操作 先放代码 import urllib import re import requeststry:from tk ...
- 使用Java编写爬虫,下载百度图片
因为最近需要很多图片素材做机器训练,所以写一个爬虫来下载百度图片里的一些图片,用作机器学习. 先看看效果图: 实现思路: 根据百度图片的Ajax请求,用Chrome获取到URL,然后通过改变URL参数 ...
- python 通达信自动下载收盘和财务数据
python 通达信自动下载收盘和财务数据,自动启动通达信,鼠标自动操作: 通达信直接从官网下载免费版,可下载财务数据. 自动识别屏幕尺寸(目前为1440x900.1920x1080.1366*768 ...
- python 福利_发现一个舔狗福利!这个Python爬虫神器太爽了,自动下载妹子图片!...
对于Python的自动化测试或者是爬虫开发者来说,对于selenium库想必都听说过,selenium本身是作为Web应用测试工具,但是作为爬虫工具也有很广泛的用途. Selenium虽然好用,但是它 ...
- Python批量自动下载获取图片
import requests from bs4 import BeautifulSoup import json import eventlet import osurlshu = 1 #url中f ...
- Python 爬虫自动下载OpenAI Key Papers
Spinning Up是OpenAI开源的面向初学者的深度强化学习资料,其中列出了105篇深度强化学习领域非常经典的文章, 见 Spinning Up: 博主使用Python爬虫自动爬取了所有文章,而 ...
最新文章
- 2500 字全方面解读 Python 的格式化输出
- Linux-6.5下 MariaDB-10基于percona-XtraBackup备份工具的原理及配置详解
- 网站迁移的一般步骤、常见问题及解决措施
- ubuntu gcc安装总结
- C++ Primer 5th笔记(chap 16 模板和泛型编程)函数模板显式实参
- 无法打开 源 文件 pch.h_outlook 客户端数据文件无法打开,如何解决?
- JVM调优:常见垃圾回收器组合
- SQL Server--用户自定义函数
- angularjsl路由_AngularJS路由和模板
- Makefile文件试错
- vue实现网络图片瀑布流 + 下拉刷新 + 上拉加载更多
- Android利用canvas画各种图形(点、直线、弧、圆、椭圆、文字、矩形、多边形、曲线、圆角矩形...
- 数据产品-产品经理必备的七大文档
- Mac下的Adobe卸载后无法重装
- android平板性价比,性价比超高的安卓娱乐平板推荐
- performance性能
- H.266/VVC相关技术学习笔记21:帧间预测中五种Merge模式的熵编码方式
- 华夏收藏网首届赛宝大会
- 一般线性模型、混合线性模型、广义线性模型
- Linux Ubuntn环境下---Redis缓存的安装和启动
热门文章
- 4路DI开关检测计数器, Modbus TCP协议,WiFi模块 WJ160
- c++ 二维矩阵 转vector_C++ vector 实现二维数组
- CCF-CSP真题《202209-2 何以包邮?》思路+python满分题解
- execution表达式
- 电脑蓝屏/中断导致 git 文件损坏的修复方法
- 【Linux】Linux进程控制 --- 进程创建、终止、等待、替换、shell派生子进程的理解…
- 考研,加油,祝福你们
- 二叉搜索树及其操作详解
- 弘辽科技:淘宝开店进货一般进多少款?开店要多少钱?
- Day88 Java框架 SSM分布式案例--商城(一)介绍