python爬虫之协程理解爬取照片的简单版
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档
文章目录
- 前言
- 一、引入库
- 二、使用步骤
- 1.上代码
- 总结
前言
协程就是异步爬取 能够快速的爬取数据 高效利用CPU 当发生等待事件 就可以执行其他的任务
一、引入库
import asyncio
#import requests 正步代码 异步会被中断
import aiohttp
import aiofiles
import time
二、使用步骤
1.上代码
代码如下(示例):
import asyncio
#import requests 正步代码 异步会被中断
import aiohttp
import aiofiles
import time
async def download(url): #用async返回函数可以当成是异步对象#url = "http://kr.shanghai-jiuxin.com/file/2020/1031/563337d07af599a9ea64e620729f367e.jpg"name = url.rsplit("/",1)[1]async with aiohttp.ClientSession() as session: #aiohttp.ClientSession() 等价于 requestsasync with session.get(url) as resp:#get请求的时候会花时间async with aiofiles.open(name,mode="wb") as f: #with能够操控文件管理 自动close()await f.write(await resp.content.read()) #resp.content.read()等价于resp.content#上面两个部分都需要等待 一个是写 一个是读取print(name,"搞定")
async def main():urls = ["http://kr.shanghai-jiuxin.com/file/2020/1031/563337d07af599a9ea64e620729f367e.jpg","http://kr.shanghai-jiuxin.com/file/2020/1031/small191468637cab2f0206f7d1d9b175ac81.jpg","http://kr.shanghai-jiuxin.com/file/2020/1031/smalld7de3f9faf1e0ecdea27b73139fc8d3a.jpg"]tasks = [] #存储异步对象for url in urls:tasks.append(asyncio.create_task(download(url)))await asyncio.wait(tasks)
if __name__ == '__main__':t1 = time.time()asyncio.run(main())t2 = time.time()print(t2-t1)#测试运行时间
该处使用的url网络请求的数据。
总结
需要注意的就是tasks里面的元素在继python3.8的时候 要记得用asyncio.creat_task(来获得元素) 不然会报错 图片的url的话 可以先用同步获取 异步也行
python爬虫之协程理解爬取照片的简单版相关推荐
- 【Python 多线程vs协程】爬取西游记
为了有效的学习和加深对于线程和协程的认知,将同一个任务用不同思路呈现很有帮助. 这里通过使用多线程以及协程两种方式对西游记的篇章内容进行爬取,来对比一下两者的耗时差异. 首先,多线程爬取. 这里没有限 ...
- python协程多任务爬取虎牙美女主播图片
使用正则.协程多任务爬取虎牙海量美女图片,斗鱼也一样,只需将正则表达式中的内容换一下即可,由于斗鱼网站的变化,之前的正则已用不了,现贴出新的: re.findall(r"https:// ...
- 从入门到入土:Python爬虫学习|实例练手|爬取猫眼榜单|Xpath定位标签爬取|代码
此博客仅用于记录个人学习进度,学识浅薄,若有错误观点欢迎评论区指出.欢迎各位前来交流.(部分材料来源网络,若有侵权,立即删除) 本人博客所有文章纯属学习之用,不涉及商业利益.不合适引用,自当删除! 若 ...
- 从入门到入土:Python爬虫学习|实例练手|爬取百度翻译|Selenium出击|绕过反爬机制|
此博客仅用于记录个人学习进度,学识浅薄,若有错误观点欢迎评论区指出.欢迎各位前来交流.(部分材料来源网络,若有侵权,立即删除) 本人博客所有文章纯属学习之用,不涉及商业利益.不合适引用,自当删除! 若 ...
- 从入门到入土:Python爬虫学习|实例练手|爬取新浪新闻搜索指定内容|Xpath定位标签爬取|代码注释详解
此博客仅用于记录个人学习进度,学识浅薄,若有错误观点欢迎评论区指出.欢迎各位前来交流.(部分材料来源网络,若有侵权,立即删除) 本人博客所有文章纯属学习之用,不涉及商业利益.不合适引用,自当删除! 若 ...
- 从入门到入土:Python爬虫学习|实例练手|爬取百度产品列表|Xpath定位标签爬取|代码注释详解
此博客仅用于记录个人学习进度,学识浅薄,若有错误观点欢迎评论区指出.欢迎各位前来交流.(部分材料来源网络,若有侵权,立即删除) 本人博客所有文章纯属学习之用,不涉及商业利益.不合适引用,自当删除! 若 ...
- Python 爬虫实战,模拟登陆爬取数据
Python 爬虫实战,模拟登陆爬取数据 从0记录爬取某网站上的资源连接: 模拟登陆 爬取数据 保存到本地 结果演示: 源网站展示: 爬到的本地文件展示: 环境准备: python环境安装 略 安装r ...
- Python爬虫利用18行代码爬取虎牙上百张小姐姐图片
Python爬虫利用18行代码爬取虎牙上百张小姐姐图片 下面开始上代码 需要用到的库 import request #页面请求 import time #用于时间延迟 import re #正则表达式 ...
- Python爬虫笔记(3)- 爬取丁香园留言
Python爬虫笔记(3)- 爬取丁香园留言 爬取丁香园留言:主要用到了模拟登录 爬取丁香园留言:主要用到了模拟登录 import requests, json, re, random,time fr ...
最新文章
- c语言字符串作为函数返回值的类型,返回字符串类型的函数怎么写?
- android ViewPager 不带滑动效果切换item
- HTTP的前世今生(HTTP1.1,HTTPS,SPDY,HTTP2.0,QUIC,HTTP3.0)
- php tiff,在PHP中将tiff转换为jpg?
- 异形3×3魔方还原教程_【理论篇】三阶魔方4.33千亿亿种变化是怎么计算出来的?...
- (递归)斐波那契数列
- python中findroot_Python源码问题算负数平方根无结果输出何解,python负数,def findRoot...
- OPNET网络仿真分析-1.5、OPNET中英文对比
- win10删除开机密码_教你电脑如何设置开机密码_win10教程
- 怎样改变计算机桌面的特效主题,教你如何更改电脑主题,桌面,图标,系统主题 - 飞机城社区论坛 - 阎良论坛 飞机城论坛,......
- 深度学习 目标分类 思路
- c语言中 x20是什么意思,转义字符的问题,\ x00- \ x20是什么意思
- 利用Github Pages搭建个人在线简历
- Android系统 linux内核按键驱动开发
- MySQL权限篇之SHOW DATABASES及SHOW VIEW
- BZOJ 3876 AHOI2014 支线剧情 费用流
- ev4加密视频转mp4工具使用教程
- moectf Amazing_eval
- Q3全球太阳能企业融资规模达30亿美元 环增76%
- 剖析Android开发未来的出路在哪里,这原因我服了
热门文章
- 5导出word_重磅更新 !支持题库导出为word
- C语言函数一章教学,C语言-第1章教学案.doc
- 用c语言加密,求助:如何用C语言实现LFSR加密
- mysql typedefinition_深入浅出Mysql——基础篇
- ksd文件怎么导入存档_DAY5-step5 Python 示例说明 ZIP 压缩文件
- 计算机网络提供服务靠,计算机网络体系结构及协议之通信子网的操作方式和网络层提供的服务...
- php输出一条直线,Photoshop脚本 绘制一条线
- php卡盟专用主机,php卡盟
- 两个字段位置相反去重_Flink零基础教程:并行度和数据重分布
- 魔力宝贝服务器修改技能经验,传说中的技能及修改建议