from bs4 import BeautifulSoup
import aiohttp  # 代替requests
import asyncio
from urllib import parseheaders={'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.198 Safari/537.36','Referer': 'https://www.qiushibaike.com/'
}async def getPage(i):print('i的值为:',i)url='https://www.qiushibaike.com/8hr/page/{}/'.format(i)async  with aiohttp.ClientSession(headers=headers) as session:async with session.get(url) as resp:print(resp.status)  # 打印状态码print('第{}页'.format(i))html=await resp.text()soup=BeautifulSoup(html,'lxml')lis=soup.select('.recmd-content')for li in lis:title=li.get_text()href=parse.urljoin('https://www.qiushibaike.com/',li['href'])print(title)print(href)if __name__ == '__main__':loop=asyncio.get_event_loop()   # 获取事件循环tasks=[getPage(i) for i in range(1,11)] # 创建任务loop.run_until_complete(asyncio.wait(tasks))    # 执行任务loop.close()    # 执行之后关闭

Python使用aiohttp异步爬取糗事百科相关推荐

  1. Python爬虫学习笔记 -- 爬取糗事百科

    Python爬虫学习笔记 -- 爬取糗事百科 代码存放地址: https://github.com/xyls2011/python/tree/master/qiushibaike 爬取网址:https ...

  2. Python爬虫实战之爬取糗事百科段子

    Python爬虫实战之爬取糗事百科段子 完整代码地址:Python爬虫实战之爬取糗事百科段子 程序代码详解: Spider1-qiushibaike.py:爬取糗事百科的8小时最新页的段子.包含的信息 ...

  3. python 爬虫实战1 爬取糗事百科段子

    首先,糗事百科大家都听说过吧?糗友们发的搞笑的段子一抓一大把,这次我们尝试一下用爬虫把他们抓取下来. 本篇目标 抓取糗事百科热门段子 过滤带有图片的段子 实现每按一次回车显示一个段子的发布时间,发布人 ...

  4. Python爬虫练习:爬取糗事百科

    本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理 以下文章来源于CSDN,作者不温卜火 爬取前的准备 糗事百科官网:https:// ...

  5. 【资料下载】Python 第三讲——正则表达式爬取糗事百科数据...

    直播时间:2月20日 20:00-21:00 直播讲师:罗攀--林学研究生<从零开始学Python网络爬虫>作者 <从零开始学Python数据分析>作者.擅长网络爬虫.数据分析 ...

  6. python爬虫——利用BeautifulSoup4爬取糗事百科的段子

    1 import requests 2 from bs4 import BeautifulSoup as bs 3 4 #获取单个页面的源代码网页 5 def gethtml(pagenum): 6 ...

  7. Python爬虫实战(1):爬取糗事百科段子

    Python爬虫入门(1):综述 Python爬虫入门(2):爬虫基础了解 Python爬虫入门(3):Urllib库的基本使用 Python爬虫入门(4):Urllib库的高级用法 Python爬虫 ...

  8. 利用Python爬取糗事百科段子信息

    文章来源:公众号-智能化IT系统. 爬虫技术目前越来越流行,这里介绍一个爬虫的简单应用. 爬取的内容为糗事百科文字内容中的信息,如图所示: 爬取糗事百科文字35页的信息,通过手动浏览,以下为前四页的网 ...

  9. python爬虫经典段子_Python爬虫实战(1):爬取糗事百科段子

    大家好,前面入门已经说了那么多基础知识了,下面我们做几个实战项目来挑战一下吧.那么这次为大家带来,Python爬取糗事百科的小段子的例子. 首先,糗事百科大家都听说过吧?糗友们发的搞笑的段子一抓一大把 ...

最新文章

  1. java内存栅栏_内存屏障(Memory Barriers/Fences) - 并发编程中最基础的一项技术
  2. MySQL的binlog日志
  3. java进制代码_Java将字节转换为十六进制代码分享
  4. Python初学者选择集成开发环境的原则!可以从以下几个方面着手
  5. wxWidgets:wxRichMessageDialog类用法
  6. [html] HTML5的Server-Sent和WebSocket有什么区别?
  7. C3P0连接池工具类使用
  8. OpenVINO Inference Engine之LoadNetwork
  9. python asyncio 高并发_python-将asyncio与多处理结合起来会出现什么样的问题(如果有)?...
  10. android 入门 (分析: 非匿名内部类 监听功能的实现)
  11. matlab幻方变换_幻方变换加密数字全息图
  12. 临湘东经子午线经度_地区经度查询_实用查询工具大全 - Powered by Senlon!
  13. 美工设计怎样可以提高自己设计能力
  14. 实证分析权重系数计算大全
  15. 计算机windows7教程,win7系统教程
  16. css3 flex弹性盒子布局梳理,打通任督二脉
  17. ToDoList 简易使用教程
  18. 大坝安全监测系统:水库“守坝人”!
  19. 一个人再牛,最终还是要靠团队
  20. PHIL 二象菲尔系统开发

热门文章

  1. DL:LinearNN(numpy自定义的) solve XOR problem
  2. Py之pyglet:Python之pyglet库的简介、安装、使用详细攻略
  3. 使用PyTorch创建神经网络
  4. jquery判断页面滚动条(scroll)是上滚还是下滚,且是否滚动到头部或者底部
  5. Set集合设置变量自增长
  6. 在.Net中进行跨线程的控件操作(上篇:Control.Invoke)
  7. 数据结构图之二(最小生成树--克鲁斯卡尔算法)
  8. [转] 书摘及访谈:Aptana RadRails,一个Rails的集成开发环境
  9. Bluetooth GAP介绍
  10. wget提示失败的解决办法