find_all()

find_all( name , attrs , recursive , string , **kwargs )

1.通过标签获取
soup.find_all("title") # 获取所有`title`标签元素
# [<title>The Dormouse's story</title>]
2.通过标签和属性获取获取
soup.find_all("p", "title") # 获取所有`class`为`title`的`p`标签
soup.find_all("p", class_= "title")  # 这个是全写形式
# [<p class="title"><b>The Dormouse's story</b></p>]soup.find_all(id="link2") # 获取所有`id`=`link2`的标签
# [<a class="sister" href="http://example.com/lacie" id="link2">Lacie</a>]# 可以结合正则表达式使用
soup.find_all(href=re.compile("elsie"))  # 获得`href`包含`elsie`的元素
# [<a class="sister" href="http://example.com/elsie" id="link1">Elsie</a>]3.通用属性获取方法`attrs`
css_class = soup.find(attrs={'class':'primaryconsumers'})

BS4 find_all相关推荐

  1. python是不是特别垃圾-震惊!垃圾分类居然能用Python搞定!

    目录 0 引言 1 环境 2 需求分析 3 代码实现 4 后记 0 引言 纸巾再湿也是干垃圾?瓜子皮再干也是湿垃圾??最近大家都被垃圾分类折磨的不行,傻傻的你是否拎得清?���自2019.07.01开 ...

  2. 用Python做垃圾分类

    0 引言 纸巾再湿也是干垃圾?瓜子皮再干也是湿垃圾??最近大家都被垃圾分类折磨的不行,傻傻的你是否拎得清????自2019.07.01开始,上海已率先实施垃圾分类制度,违反规定的还会面临罚款. 为了避 ...

  3. 震惊!垃圾分类居然能用Python搞定!

    目录 0 引言 1 环境 2 需求分析 3 代码实现 4 后记 0 引言 纸巾再湿也是干垃圾?瓜子皮再干也是湿垃圾??最近大家都被垃圾分类折磨的不行,傻傻的你是否拎得清????自2019.07.01开 ...

  4. 循序渐进学爬虫:多线程+队列爬取豆瓣高分计算机类书籍

    上一次的抓取豆瓣高分计算机书籍的案例,采用的是完全同步的方式.即单个线程依次执行完所有的逻辑,这样存在的问题就是我们的爬虫程序会非常的慢. 所以本文作为上一次案例的升级版本,通过循序渐进.动手实践的方 ...

  5. 循序渐进学爬虫:多线程+队列爬取豆瓣高分计算机类书籍 1

    上一次的抓取豆瓣高分计算机书籍的案例,采用的是完全同步的方式.即单个线程依次执行完所有的逻辑,这样存在的问题就是我们的爬虫程序会非常的慢. 所以本文作为上一次案例的升级版本,通过循序渐进.动手实践的方 ...

  6. Python 开发代码片段笔记

    作者编写的一些代码片段,本版本为残废删减版,没有加入多线程,也没有实现任何有价值的功能,只是一个临时记事本,记录下本人编写代码的一些思路,有价值的完整版就不发出来了,自己组织吧,代码没啥技术含量,毕竟 ...

  7. Python5--下载知乎关注者头像

    这次这玩意折腾我了半天,终于成功了/(ㄒoㄒ)/~~.急需把中间遇到的问题详细记录下来宣泄一下 在前面代码的基础上,想尝试将知乎上关注某话题的用户头像爬取下来.在参考了知乎大神们的回答之后,修改完善了 ...

  8. python爬虫实战,爬取洛杉矶上千房源!

    前言 最近打算签证流程结束后,开始看看加州的房子了,毕竟研究生是不太容易住校内的,具体来说还是看看洛杉矶的房源.因为网站在国外,访问比较慢,不同页的也不好比较,于是想着把它全部爬取下来整理成docx文 ...

  9. python bs4 find_all_BeautifulSoup中的find,find_all

    1.一般来说,为了找到BeautifulSoup对象内任何第一个标签入口,使用find()方法. 以上代码是一个生态金字塔的简单展示,为了找到第一生产者,第一消费者或第二消费者,可以使用Beautif ...

最新文章

  1. 百亿数据,毫秒级返回,如何构建?
  2. Nature:1000种植物的测序揭示10亿年来的进化
  3. 【bzoj1486】【[HNOI2009]梦幻布丁】启发式链表合并(详解)
  4. RPA或成为日本大银行“瘦身”潮的催化剂
  5. linux 内核将两个设备相关联,linux用户空间和内核空间交换数据
  6. c语言插件实现原理,C语言实现插件机制
  7. 三级菜单 python_python三级菜单
  8. 谷歌浏览器书签栏怎么隐藏 谷歌Chrome浏览器书签栏隐藏教程
  9. tensorflow 安装_安装tensorflow-gpu 2.0
  10. 发展下一代互联网的动力
  11. Elasticsearch核心知识点大全
  12. SPI DMA 通信配置
  13. 爬取楼盘网并将数据保存在excel表中
  14. AD19 keepoutlayer相关
  15. vue 视频长传与预览
  16. 安卓一键清理内存_微清理下载软件-微清理app下载v1.0.1.2 安卓版
  17. 【养生】【作息】作息+十二时辰养生
  18. gtx1070显卡 linux,Ubuntu 16.04下Nvidia 显卡驱动安装
  19. 【以终为始】接到需求任务,你要先做哪件事?
  20. 高恪智能流控怎么设置_[高恪小知识]自定义流控的操作

热门文章

  1. 数组和JSON之间的格式转换
  2. Python标准库collections中与字典有关的类
  3. linux shell 命令记录,linux常用shell命令记录
  4. 力扣35,搜索插入位置(JavaScript)
  5. linux系统获取光盘信息api,C++ 通过WIN32 API 获取逻辑磁盘详细信息的几种方法
  6. jquery获取动态表格行号_jquery得到表格当前行数据
  7. python画画用哪库好_学Python画画:应用Turtle库画一个蠢萌的小黄人
  8. php批量getshell,任意文件上传引发的批量Getshell到服务器 - WileySec's Blog
  9. android java框架_【阿里P8大牛教你Android入门之路(java篇)】——Java集合框架(系列篇1)...
  10. java php json转字符串_php json字符串转为数组或对象