Beautiful Soup库是解析,遍历,维护“标签树”的功能库。
条件:
pip install lxml
pip install html5lib

以下5种基本元素是使用方法!
Tag:标签,最基本的信息组织单元,分别用<>和</>标明开头和结尾

提前要写的代码:

import requests
r = requests.get("https://python123.io/ws/demo.html")
r.text
demo = r.text
from bs4 import BeautifulSoup
soup = BeautifulSoup(demo , "html.parser")
print(soup.prettify())

执行结果:(比例不对就用放大镜查看!)

做汤:

可以查看标题!

Name:标签的名字,<p>...</p>的名字是'p',格式:<tag>.name

(比例不对就用放大镜查看!)

获取标签名字:

它父亲的名字,就是上一层的:

其父亲的上一层的名字:

Attributes:标签的属性,字典的形式组织,格式:<tag>.attrs

说明标签特点:

有一个字典。

上图为字典属性值。

上图为连接属性值。

标签属性类型:

为字典类型。

tag标签属性:

NavigableString:标签内非属性字符串,<>...</>中字符串,格式:<tag>.string

a标签的字符串信息:

p标签:

p标签的字符串信息:

Comment:标签内字符串的注释部分,一种特殊的Comment类型

处理注释部分:

Python Beautiful Soup类的基本元素相关推荐

  1. html标签 补全方法 python,Python Beautiful Soup学习之HTML标签补全功能

    Beautiful Soup是一个非常流行的Python模块.该模块可以解析网页,并提供定位内容的便捷接口. 使用下面两个命令安装: pip install beautifulsoup4或者 sudo ...

  2. Python : Beautiful Soup修改文档树

    修改文档树 Beautiful Soup的强项是文档树的搜索,但同时也可以方便的修改文档树 修改tag的名称和属性 在 Attributes 的章节中已经介绍过这个功能,但是再看一遍也无妨. 重命名一 ...

  3. python中beautifulsoup_面向新手解析python Beautiful Soup基本用法

    Beautiful Soup就是Python的一个HTML或XML的解析库,可以用它来方便地从网页中提取数据.它有如下三个特点: Beautiful Soup提供一些简单的.Python式的函数来处理 ...

  4. python beautiful soup 标签完全相同_Python爬取Python教程并制作成pdf

    欢迎点击右上角关注小编,除了分享技术文章之外还有很多福利,私信学习资料可以领取包括不限于Python实战演练.PDF电子文档.面试集锦.学习资料等. 想要把教程变成PDF有三步: 1.先生成空html ...

  5. python Beautiful Soup常用过滤方法

    1.Beautiful Soup from bs4 import BeautifulSoup soup = BeautifulSoup('<p>Hello</p>','lxml ...

  6. python中beautifulsoup是什么,Python Beautiful Soup简介

    Beautiful Soup简介 Beautiful Soup 是一个可以从HTML或XML文件中提取数据的Python库.它能够通过你喜欢的转换器实现惯用的文档导航,查找,修改文档的方式. Beau ...

  7. 【Python beautiful soup】如何用beautiful soup 解析HTML内容

    美丽汤(Beautiful Soup)是一个流行的Python库,用于从HTML或XML文件中提取数据.它将复杂的HTML文件转化为一个Python对象,使得用户可以更方便地解析.搜索和修改HTML内 ...

  8. python soup_面向新手解析python Beautiful Soup基本用法

    Beautiful Soup就是Python的一个HTML或XML的解析库,可以用它来方便地从网页中提取数据.它有如下三个特点: Beautiful Soup提供一些简单的.Python式的函数来处理 ...

  9. 【学习笔记】Python - Beautiful Soup

    Beautiful Soup Beautiful Soup是一个模块,用于从HTML页面中提取信息(类似于正则表达式的功能).Beautiful Soup的模块名称是"bs4"(表 ...

最新文章

  1. AlwaysOn只读路由配置
  2. boost::hof::rotate用法的测试程序
  3. SAP 电商云 Spartacus UI 的单元测试和端到端测试,以及 CI/CD 相关话题
  4. OpenFOAM中slip和noslip介绍(滑移条件无滑移条件)【翻译】
  5. 存款惊人_如何使您的图快速美丽惊人
  6. 深入研究Python 世界的规则,我的薪资直接翻倍
  7. rmse多少算效果好_关键词SEO优化带来流量有多少?如何做SEO优化效果好?
  8. HTML+CSS实现轮播图效果
  9. 基于SaltStack完成LVS的配置管理
  10. java导入hbase_如何用java导入hbase.dat文件
  11. HTML5定稿一周年,你必须要重新认识HTML5了
  12. endnote x9破解版怎么导入word 2019使用呢?
  13. 预测未来的神技---马尔科夫模型
  14. jQuery 点击图片放大 灯箱效果
  15. 论文解读GNNs Exponentially Lose Expressive Power For Node Classification
  16. 超卓航科上市:募资9亿市值超60亿 成襄阳首家科创板企业
  17. 基于Trie树进行拆分字符串变成拼音音节(二):字符串拼音拆分
  18. qlist 嵌套_QList内存释放
  19. 关于word文档受保护的问题,不能编辑,转成能编辑的文档
  20. C++ 11 14 RAII经典用法

热门文章

  1. “神人”or“闲人”?你的未来由AI与大数据决定
  2. 京东数科业务架构全披露,陈生强发布城市操作系统和京东钼媒
  3. 公开课 | 人脸识别的最新进展以及工业级大规模人脸识别实践探讨
  4. 从YOLOv1到YOLOv3,目标检测的进化之路
  5. 阿里资深AI工程师教你逐个击破机器学习核心算法
  6. 资源 | 做一款炫酷的机器人需要哪些学习资源(机器人资源Awesome系列)
  7. 我用kafka两年踩过的一些非比寻常的坑
  8. 关于Redis缓存,这3个问题一定要知道!
  9. 今晚带你真正认识Linux 系统结构
  10. 太强了!这款轻量级的数据库中间件完美解决了SpringBoot中分库分表问题