1. BeautifulSoup类的基本元素
基本元素 说明
Tag 标签,最基本的信息组织单元,分别用<>和</>标明开头和结尾
Name 标签的名字,<p>…</p>的名字是'p',格式:<tag>.name
Attributes 标签的属性,字典形式组织,格式:<tag>.attrs
NavigableString 标签内非属性字符串,<>…</>中字符串,格式:<tag>.string
Comment 标签内字符串的注释部分,一种特殊的Comment类型

注:任何存在于HTML语法中的标签都可以用soup.<tag>访问获得
当HTML文档中存在多个相同<tag>对应内容时,soup.<tag>返回第一个

#基本类型
print(soup.title)
print(soup.a)
print(soup.a.parent.name)
print(soup.a.parent.parent.name)
print(soup.a.attrs)
print(soup.a.attrs['class'])
print(soup.a.attrs['href'])
print(type(soup.a.attrs))
print(type(soup.a))print(soup.a.string)
print(soup.p)
print(soup.p.string)
print(type(soup.p.string))
##HTML注释
newsoup = BeautifulSoup("<b><!--This is a comment--></b><p>This is not a comment</p>","html.parser")
print(newsoup.b.string)
print(type(newsoup.b.string))
print(newsoup.p.string)
print(type(newsoup.p.string))
  1. 基于bs4库的HTML格式输出
print(soup.prettify())

转载于:https://www.cnblogs.com/machine-lyc/p/10264006.html

BeautifulSoap库入门相关推荐

  1. python向量计算库教程_NumPy库入门教程:基础知识总结

    原标题:NumPy库入门教程:基础知识总结 视学算法 | 作者 知乎专栏 | 来源 numpy可以说是 Python运用于人工智能和科学计算的一个重要基础,近段时间恰好学习了numpy,pandas, ...

  2. python中requests库入门及写入文件

    1.python中requests库入门 import requests r = requests.get("https://www.baidu.com") print(r.sta ...

  3. 【NLP】5计数词向量底层代码编写和gensim word2vec库入门——斯坦福大学CS224n第一次课作业代码复现

    gensim word2vec库入门 背景:词向量 第一部分:基于计数的词向量 共现矩阵 绘制共现词嵌入图 问题1.1:实现distinct_words 问题1.2:实现compute_co_occu ...

  4. Python 数据科学库入门

    Python 数据科学库入门 1.Numpy 1.1Numpy 简介 Numpy(Numerical Python) Numpy:提供了一个在 Python 中做科学计算的基础库,重在数值计算,主要用 ...

  5. 音视频开发5. ZLMediaKit库入门使用 编译安装

    音视频开发5. ZLMediaKit库入门使用 编译安装 一. ZLMediaKit 库简介 二.编译 三.生成物 1. MedisServer 2. SDK (c语言) 3. 测试程序 4. 问题处 ...

  6. Anylogic轨道库入门

    轨道库入门--以Railway Station案例为例 轨道库--Railway library 轨道库示例--Railway Station 整体结构一览 GoToPlatformAndBoard ...

  7. 易语言 服务器 xml,易语言XML支持库入门教程源码

    易语言XML支持库入门教程系统结构:易语言XML支持库入门教程源码,XML支持库入门教程 ======窗口程序集1 || ||------_按钮_创建XML_被单击 || ||------_按钮_释放 ...

  8. Beautifu Soup库入门

    Beautifu Soup库入门 python 爬虫 BeautifulSoup库 Beautiful Soup库的基本元素 Beautiful Soup库的理解 BeautifulSoup对应于一个 ...

  9. g2o图优化库入门介绍

    g2o图优化库入门介绍 1.背景知识介绍 2.代码详解 一.点和边的类型定义 二.构建图优化实例,配置求解器 三.添加点和边 四.执行优化 3.ax2+bx+c实现 一.程序: 二.运行结果 1.背景 ...

  10. EasyX库入门学习

    EasyX库入门学习 文章目录 EasyX库入门学习 1.EasyX的基本说明 2.EasyX的安装 3.EasyX的使用 1) 三个基本概念:颜色,坐标,设备 2) 绘制环境 3) 个人示例程序 4 ...

最新文章

  1. python asyncio回调函数_最近用 Python 的 asyncio,有好多不懂。。
  2. 这样就可以很方便的知道明天的天气了
  3. java并发编程实践_Java并发编程实践如何正确使用Unsafe
  4. volatile和final
  5. matlab multithreading spyder,spyder和python的关系是什么
  6. Django echarts初试随笔
  7. COM.MYSQL.JDBC.DRIVER 和 COM.MYSQL.CJ.JDBC.DRIVER的区别
  8. 洛谷 P3732 [HAOI2017]供给侧改革【trie树】
  9. bzoj2595 [Wc2008]游览计划
  10. mac idea命令精简使用版常用指令
  11. JSON数据格式转换(StringBuffer拼接json串)大全及用法
  12. Python中self的用法详解(链接传送)
  13. [C++]面向对象部分——类
  14. scipy库中的leastsq函数
  15. InnoDB下SQL执行底层原理和redolog、binlog
  16. Python快速编程入门#学习笔记06# |第6章 :函数(学生管理系统)
  17. Python 多线程 threading.Thread 同时最多有 n 个线程
  18. ZSD018出货明细表
  19. 【日常】我的创作纪念日 2022
  20. 爬虫 爬取不到数据原因总结

热门文章

  1. vs2017+pcl1.8.1配置
  2. python resize重置大小
  3. plt.imshow与cv2.imshow显示颜色问题
  4. 2021-08-13 初识servlet
  5. java io 创建临时文件,用Java创建一个指定的临时文件
  6. 施密特正交化_夜思 | 为什么非实对称矩阵对应的特征向量不能施密特正交化?...
  7. Hyperledger Fabric教程(12)--链码chaincode样例
  8. springboot注解式AOP通过JoinPoint获取参数 学习笔记
  9. 锐捷服务器有什么型号,锐捷管理服务器RG-RCMS-16
  10. 我要发明计算机作文,我要发明机器人作文700字