Python Beautiful Soup类的基本元素
Beautiful Soup库是解析,遍历,维护“标签树”的功能库。
条件:
pip install lxml
pip install html5lib
以下5种基本元素是使用方法!
Tag:标签,最基本的信息组织单元,分别用<>和</>标明开头和结尾
提前要写的代码:
import requests
r = requests.get("https://python123.io/ws/demo.html")
r.text
demo = r.text
from bs4 import BeautifulSoup
soup = BeautifulSoup(demo , "html.parser")
print(soup.prettify())
执行结果:(比例不对就用放大镜查看!)
做汤:
可以查看标题!
Name:标签的名字,<p>...</p>的名字是'p',格式:<tag>.name
(比例不对就用放大镜查看!)
获取标签名字:
它父亲的名字,就是上一层的:
其父亲的上一层的名字:
Attributes:标签的属性,字典的形式组织,格式:<tag>.attrs
说明标签特点:
有一个字典。
上图为字典属性值。
上图为连接属性值。
标签属性类型:
为字典类型。
tag标签属性:
NavigableString:标签内非属性字符串,<>...</>中字符串,格式:<tag>.string
a标签的字符串信息:
p标签:
p标签的字符串信息:
Comment:标签内字符串的注释部分,一种特殊的Comment类型
处理注释部分:
Python Beautiful Soup类的基本元素相关推荐
- html标签 补全方法 python,Python Beautiful Soup学习之HTML标签补全功能
Beautiful Soup是一个非常流行的Python模块.该模块可以解析网页,并提供定位内容的便捷接口. 使用下面两个命令安装: pip install beautifulsoup4或者 sudo ...
- Python : Beautiful Soup修改文档树
修改文档树 Beautiful Soup的强项是文档树的搜索,但同时也可以方便的修改文档树 修改tag的名称和属性 在 Attributes 的章节中已经介绍过这个功能,但是再看一遍也无妨. 重命名一 ...
- python中beautifulsoup_面向新手解析python Beautiful Soup基本用法
Beautiful Soup就是Python的一个HTML或XML的解析库,可以用它来方便地从网页中提取数据.它有如下三个特点: Beautiful Soup提供一些简单的.Python式的函数来处理 ...
- python beautiful soup 标签完全相同_Python爬取Python教程并制作成pdf
欢迎点击右上角关注小编,除了分享技术文章之外还有很多福利,私信学习资料可以领取包括不限于Python实战演练.PDF电子文档.面试集锦.学习资料等. 想要把教程变成PDF有三步: 1.先生成空html ...
- python Beautiful Soup常用过滤方法
1.Beautiful Soup from bs4 import BeautifulSoup soup = BeautifulSoup('<p>Hello</p>','lxml ...
- python中beautifulsoup是什么,Python Beautiful Soup简介
Beautiful Soup简介 Beautiful Soup 是一个可以从HTML或XML文件中提取数据的Python库.它能够通过你喜欢的转换器实现惯用的文档导航,查找,修改文档的方式. Beau ...
- 【Python beautiful soup】如何用beautiful soup 解析HTML内容
美丽汤(Beautiful Soup)是一个流行的Python库,用于从HTML或XML文件中提取数据.它将复杂的HTML文件转化为一个Python对象,使得用户可以更方便地解析.搜索和修改HTML内 ...
- python soup_面向新手解析python Beautiful Soup基本用法
Beautiful Soup就是Python的一个HTML或XML的解析库,可以用它来方便地从网页中提取数据.它有如下三个特点: Beautiful Soup提供一些简单的.Python式的函数来处理 ...
- 【学习笔记】Python - Beautiful Soup
Beautiful Soup Beautiful Soup是一个模块,用于从HTML页面中提取信息(类似于正则表达式的功能).Beautiful Soup的模块名称是"bs4"(表 ...
最新文章
- AlwaysOn只读路由配置
- boost::hof::rotate用法的测试程序
- SAP 电商云 Spartacus UI 的单元测试和端到端测试,以及 CI/CD 相关话题
- OpenFOAM中slip和noslip介绍(滑移条件无滑移条件)【翻译】
- 存款惊人_如何使您的图快速美丽惊人
- 深入研究Python 世界的规则,我的薪资直接翻倍
- rmse多少算效果好_关键词SEO优化带来流量有多少?如何做SEO优化效果好?
- HTML+CSS实现轮播图效果
- 基于SaltStack完成LVS的配置管理
- java导入hbase_如何用java导入hbase.dat文件
- HTML5定稿一周年,你必须要重新认识HTML5了
- endnote x9破解版怎么导入word 2019使用呢?
- 预测未来的神技---马尔科夫模型
- jQuery 点击图片放大 灯箱效果
- 论文解读GNNs Exponentially Lose Expressive Power For Node Classification
- 超卓航科上市:募资9亿市值超60亿 成襄阳首家科创板企业
- 基于Trie树进行拆分字符串变成拼音音节(二):字符串拼音拆分
- qlist 嵌套_QList内存释放
- 关于word文档受保护的问题,不能编辑,转成能编辑的文档
- C++ 11 14 RAII经典用法
热门文章
- “神人”or“闲人”?你的未来由AI与大数据决定
- 京东数科业务架构全披露,陈生强发布城市操作系统和京东钼媒
- 公开课 | 人脸识别的最新进展以及工业级大规模人脸识别实践探讨
- 从YOLOv1到YOLOv3,目标检测的进化之路
- 阿里资深AI工程师教你逐个击破机器学习核心算法
- 资源 | 做一款炫酷的机器人需要哪些学习资源(机器人资源Awesome系列)
- 我用kafka两年踩过的一些非比寻常的坑
- 关于Redis缓存,这3个问题一定要知道!
- 今晚带你真正认识Linux 系统结构
- 太强了!这款轻量级的数据库中间件完美解决了SpringBoot中分库分表问题