BeautifulSoap库入门
- BeautifulSoup类的基本元素
基本元素 | 说明 |
---|---|
Tag | 标签,最基本的信息组织单元,分别用<>和</>标明开头和结尾 |
Name | 标签的名字,<p>…</p>的名字是'p',格式:<tag>.name |
Attributes | 标签的属性,字典形式组织,格式:<tag>.attrs |
NavigableString | 标签内非属性字符串,<>…</>中字符串,格式:<tag>.string |
Comment | 标签内字符串的注释部分,一种特殊的Comment类型 |
注:任何存在于HTML语法中的标签都可以用soup.<tag>访问获得
当HTML文档中存在多个相同<tag>对应内容时,soup.<tag>返回第一个
#基本类型
print(soup.title)
print(soup.a)
print(soup.a.parent.name)
print(soup.a.parent.parent.name)
print(soup.a.attrs)
print(soup.a.attrs['class'])
print(soup.a.attrs['href'])
print(type(soup.a.attrs))
print(type(soup.a))print(soup.a.string)
print(soup.p)
print(soup.p.string)
print(type(soup.p.string))
##HTML注释
newsoup = BeautifulSoup("<b><!--This is a comment--></b><p>This is not a comment</p>","html.parser")
print(newsoup.b.string)
print(type(newsoup.b.string))
print(newsoup.p.string)
print(type(newsoup.p.string))
- 基于bs4库的HTML格式输出
print(soup.prettify())
转载于:https://www.cnblogs.com/machine-lyc/p/10264006.html
BeautifulSoap库入门相关推荐
- python向量计算库教程_NumPy库入门教程:基础知识总结
原标题:NumPy库入门教程:基础知识总结 视学算法 | 作者 知乎专栏 | 来源 numpy可以说是 Python运用于人工智能和科学计算的一个重要基础,近段时间恰好学习了numpy,pandas, ...
- python中requests库入门及写入文件
1.python中requests库入门 import requests r = requests.get("https://www.baidu.com") print(r.sta ...
- 【NLP】5计数词向量底层代码编写和gensim word2vec库入门——斯坦福大学CS224n第一次课作业代码复现
gensim word2vec库入门 背景:词向量 第一部分:基于计数的词向量 共现矩阵 绘制共现词嵌入图 问题1.1:实现distinct_words 问题1.2:实现compute_co_occu ...
- Python 数据科学库入门
Python 数据科学库入门 1.Numpy 1.1Numpy 简介 Numpy(Numerical Python) Numpy:提供了一个在 Python 中做科学计算的基础库,重在数值计算,主要用 ...
- 音视频开发5. ZLMediaKit库入门使用 编译安装
音视频开发5. ZLMediaKit库入门使用 编译安装 一. ZLMediaKit 库简介 二.编译 三.生成物 1. MedisServer 2. SDK (c语言) 3. 测试程序 4. 问题处 ...
- Anylogic轨道库入门
轨道库入门--以Railway Station案例为例 轨道库--Railway library 轨道库示例--Railway Station 整体结构一览 GoToPlatformAndBoard ...
- 易语言 服务器 xml,易语言XML支持库入门教程源码
易语言XML支持库入门教程系统结构:易语言XML支持库入门教程源码,XML支持库入门教程 ======窗口程序集1 || ||------_按钮_创建XML_被单击 || ||------_按钮_释放 ...
- Beautifu Soup库入门
Beautifu Soup库入门 python 爬虫 BeautifulSoup库 Beautiful Soup库的基本元素 Beautiful Soup库的理解 BeautifulSoup对应于一个 ...
- g2o图优化库入门介绍
g2o图优化库入门介绍 1.背景知识介绍 2.代码详解 一.点和边的类型定义 二.构建图优化实例,配置求解器 三.添加点和边 四.执行优化 3.ax2+bx+c实现 一.程序: 二.运行结果 1.背景 ...
- EasyX库入门学习
EasyX库入门学习 文章目录 EasyX库入门学习 1.EasyX的基本说明 2.EasyX的安装 3.EasyX的使用 1) 三个基本概念:颜色,坐标,设备 2) 绘制环境 3) 个人示例程序 4 ...
最新文章
- python asyncio回调函数_最近用 Python 的 asyncio,有好多不懂。。
- 这样就可以很方便的知道明天的天气了
- java并发编程实践_Java并发编程实践如何正确使用Unsafe
- volatile和final
- matlab multithreading spyder,spyder和python的关系是什么
- Django echarts初试随笔
- COM.MYSQL.JDBC.DRIVER 和 COM.MYSQL.CJ.JDBC.DRIVER的区别
- 洛谷 P3732 [HAOI2017]供给侧改革【trie树】
- bzoj2595 [Wc2008]游览计划
- mac idea命令精简使用版常用指令
- JSON数据格式转换(StringBuffer拼接json串)大全及用法
- Python中self的用法详解(链接传送)
- [C++]面向对象部分——类
- scipy库中的leastsq函数
- InnoDB下SQL执行底层原理和redolog、binlog
- Python快速编程入门#学习笔记06# |第6章 :函数(学生管理系统)
- Python 多线程 threading.Thread 同时最多有 n 个线程
- ZSD018出货明细表
- 【日常】我的创作纪念日 2022
- 爬虫 爬取不到数据原因总结
热门文章
- vs2017+pcl1.8.1配置
- python resize重置大小
- plt.imshow与cv2.imshow显示颜色问题
- 2021-08-13 初识servlet
- java io 创建临时文件,用Java创建一个指定的临时文件
- 施密特正交化_夜思 | 为什么非实对称矩阵对应的特征向量不能施密特正交化?...
- Hyperledger Fabric教程(12)--链码chaincode样例
- springboot注解式AOP通过JoinPoint获取参数 学习笔记
- 锐捷服务器有什么型号,锐捷管理服务器RG-RCMS-16
- 我要发明计算机作文,我要发明机器人作文700字