https://cuiqingcai.com/1319.html

Python -BS4详细介绍
Python 在处理html方面有很多的优势,一般情况下是要先学习正则表达式的.
在应用过程中有很多模块是非常方便的,先尝试使用BeautifulSoup和Urllib进行网页的处理,仅供学习.
首先列举所需要导入的模块:
from bs4 import BeautifulSoup    # 处理获取的网页信息
import bs4                                    # 用于判读各类类型                  
import os                                       #系统模块,详细信息整理于下一章节
import re                                        # 正则表达式,其实用不到
import time                                    # 时间模块,用于设置超时处理等
from urllib import request               # 用于获取网页信息
相关操作:
url = 'HTTP://XXXX'    # 定义网页地址
respons = request.urlopen(url,data=None,timeout=2)     # 打开地址
data = respons.read().decode('utf-8')   # 读取网页信息
soup = BeautifulSoup(data, "html5lib")                          # 用BeautifulSoup 解析
href = soup.find_all('a',target = "XXXX")  # BS4最重要的函数,获取相关节点儿,详细信息自行学习
###
剩下的就自己处理就行了.
于2018-6-5 补充如下:

关于解析器引用官方文档截图:

1. tag

tag中最重要的属性: name和attributes

tag.name 和tag["XXX"]

2. tag.string 和 tag.strings  获取字符内容

3.    find_all( name , attrs , recursive , text , **kwargs )

name:tag的name

attrs : 属性

转载于:https://www.cnblogs.com/moying-wq/p/10009805.html

Python -bs4介绍相关推荐

  1. python房地产爬虫_房产中介网站爬虫实战(Python BS4+多线程)(一)

    本系列文章介绍了爬取链家和搜房网(房天下)数据的方法. 房产中介网站爬虫实战(Python BS4+多线程)(一) 房产中介网站爬虫实战(Python BS4+多线程)(二) 房地产市场向来是大数据分 ...

  2. Python BS4解析库用法详解

    Python BS4解析库用法详解 Beautiful Soup 简称 BS4(其中 4 表示版本号)是一个 Python 第三方库,它可以从 HTML 或 XML 文档中快速地提取指定的数据.Bea ...

  3. Python bs4解析库使用详解

    今天继续给大家介绍Python 爬虫相关知识,本文主要内容是Python bs4解析库使用详解. 一.Python bs4库简介与安装 bs4是Python的一个第三方库,主要用于从HTML或者是XM ...

  4. Blender中的Python脚本介绍学习教程

    Blender中的Python脚本介绍学习教程 MP4 |视频:h264,1280×720 |音频:AAC,48000 Hz 语言:英语+中英文字幕(根据原英文字幕机译更准确)|大小解压后:1.63 ...

  5. python软件界面-python软件界面介绍(python软件介绍)

    python软件界面介绍 1.接口初始化 当我们使用pycharm工具时,我们将遇到的第一个问题是,在进行各种配置后界面变得混乱时,我们该怎么办?我们应该还原,那么如何还原初始设置? 尽管此工具是从e ...

  6. python语言简介-Python语言介绍

    原标题:Python语言介绍 Python简介 Python 是一个高层次的结合了解释性.编译性.互动性和面向对象的脚本语言. Python 的设计具有很强的可读性,相比其他语言经常使用英文关键字,其 ...

  7. python语言介绍-00-python语言介绍

    以下为摘录的python的介绍 Python是一种解释型语言.这就是说,与C语言和C的衍生语言不同,Python代码在运行之前不需要编译.其他解释型语言还包括PHP和Ruby. Python是动态类型 ...

  8. python介绍和用途-Python基础介绍(一)

    Python基础介绍(一) 1. python是什么编程语言 编译型与解释型 ​编译器吧源程序的每一条语句都编译成机器语言,并保存成二进制文件,这样运行时计算机可以直接以极其语言来运行此程序,速度很快 ...

  9. python介绍和用途-python应用领域介绍

    python应用领域介绍Python作为一种功能强大且通用的编程语言而广受好评,它具有非常清晰的语法特点,适用于多种操作系统,目前在国际上非常流行,正在得到越来越多的应用. 下面就让我们一起来看看它的 ...

最新文章

  1. C++标准库中sstream和strstream的区别
  2. Android的全屏活动?
  3. er图用什么软件_从软件开发生命周期看商业智能 BI 数据仓库建模
  4. 机器学习流行算法一览
  5. [渝粤教育] 宁波大学 聆听中国 参考 资料
  6. 阿里云高级技术专家张毅萍:我眼中的边缘计算
  7. mysql中grade字段降序排列_Mysql order by 多个字段排序
  8. python攻击校园网_python爬虫 模拟登陆校园网-初级
  9. 复杂性思维中文第二版 十二、合作进化
  10. 两台电脑串口通信实现文件传输
  11. 对账、结账、错账更正方法、划线更正法、红字更正法、补充登记法
  12. css 实现对话气泡
  13. 如何将照片从iPhone导入到Mac
  14. nyoj-239 月老的难题 (二分图匹配—匈牙利算法 网络流—Dinic算法)
  15. php db mssql 2008,php mssql 不能用 DB-Library(如 ISQL)或 ODBC 3.7 或更早版
  16. Termux 速成指南
  17. Auto-Rig Pro文档翻译:安装
  18. 谈谈java中封装的那点事
  19. win10+cuda10.0+pytorch安装
  20. python格式化方式

热门文章

  1. 安卓APP_ Fragment(2)—— Activity与Fragment的通信
  2. 用户id可以出现在url中吗_下载Google Drive中的文件
  3. android 过滤数组中的重复元素,Flutter List数组避免插入重复数据的实现
  4. 项目管理基础:系统分析相关概念介绍
  5. 程序幽默:会让程序员争论起来的几个话题
  6. C#中DateTime.Ticks属性及Unix时间戳转换
  7. 带wiringPi库的交叉编译
  8. nginx php7提速,nginx+php7-fpm 性能提升几倍跟踪实践结果并优化
  9. 内连接(INNER JOIN)
  10. 2021 年最值得了解的 Node.js 工具(下)