可以利用 pip 来安装:

pip install beautifulsoup4

源代码:

import requests
r = requests.get("https://python123.io/ws/demo.html")
r.text
demo = r.text
from bs4 import BeautifulSoup
soup = BeautifulSoup(demo , "html.parser")
print(soup.prettify())

原网页,右键查看源代码:

利用爬虫执行之后:

可以看到树形的代码结构!

技术参考文档:https://cuiqingcai.com/1319.html

Python爬虫利器之Beautiful Soup的用法,以及实例!相关推荐

  1. Python爬虫利器之Beautiful Soup的全世界最强用法 五百行文章!

    0. 前言 爬虫是一个非常有意思的东西,比如自己做的一个网页上面什么数据都没有就可以爬虫别人的 然后进行去重 数据分析等等 在这里因为爬虫涉及到的方面非常多 1. Beautiful Soup的简介 ...

  2. Python爬虫利器之PhantomJS的用法

    前言 大家有没有发现之前我们写的爬虫都有一个共性,就是只能爬取单纯的html代码,如果页面是JS渲染的该怎么办呢?如果我们单纯去分析一个个后台的请求,手动去摸索JS渲染的到的一些结果,那简直没天理了. ...

  3. Python 爬虫利器之 Pyppeteer 的用法

    如果大家对 Python 爬虫有所了解的话,想必你应该听说过 Selenium 这个库,这实际上是一个自动化测试工具,现在已经被广泛用于网络爬虫中来应对 JavaScript 渲染的页面的抓取. 很多 ...

  4. 【Python爬虫】 之 Beautiful Soup

    一.Beautiful Soup简介 Beautiful Soup 是基于HTML DOM的,会载入整个文档,解析整个DOM树,因此时间和内存开销都会大很多,所以性能要低于lxml,因为lxml只会局 ...

  5. 芝麻HTTP: Python爬虫利器之PyQuery的用法

    2019独角兽企业重金招聘Python工程师标准>>> 前言 你是否觉得 XPath 的用法多少有点晦涩难记呢? 你是否觉得 BeautifulSoup 的语法多少有些悭吝难懂呢? ...

  6. python爬虫利器之scrapy的基本教程

    安装 Scrapy 是一个十分强大的爬虫框架,使用 pip 来安装 scrapy 需要安装大量的依赖库,至少需要的依赖库有 Twisted,lxml,pyOpenSSL.而在不同平台环境又各不相同,所 ...

  7. Python爬虫入门(8):Beautiful Soup的用法

    Python爬虫入门(1):综述 Python爬虫入门(2):爬虫基础了解 Python爬虫入门(3):Urllib库的基本使用 Python爬虫入门(4):Urllib库的高级用法 Python爬虫 ...

  8. Python爬虫利器二之Beautiful Soup的用法

    如果一个正则匹配稍有差池,那可能程序就处在永久的循环之中,没关系,我们还有一个更强大的工具,叫Beautiful Soup,有了它我们可以很方便地提取出HTML或XML标签中的内容. 1. Beaut ...

  9. python中beautifulsoup_面向新手解析python Beautiful Soup基本用法

    Beautiful Soup就是Python的一个HTML或XML的解析库,可以用它来方便地从网页中提取数据.它有如下三个特点: Beautiful Soup提供一些简单的.Python式的函数来处理 ...

最新文章

  1. 消失,只为一个人存在……
  2. elk示例-精简版2
  3. 汇编语言 明明定义了栈仍然no stack segment 以及栈空间数据被篡改问题
  4. 让我们共同怀揣文学与艺术的梦想
  5. apache禁止多目录运行php文件下载,Nginx Apache下如何禁止指定目录运行PHP脚本
  6. C#设计模式之4-原型模式
  7. AngularJS控制器和过滤器学习(三)
  8. Windows版本nginx
  9. Gitlab 回滚到某个commit
  10. [buuctf.reverse] 131-135
  11. 小程序 php 获取openid和 微信运动步数 解密运动数据
  12. 使用php下载网络图片有哪些方法,php下载网络图片常用的三个方法总结_后端开发...
  13. powermockito测试私有方法_03 增强测试: 静态、私有方法处理
  14. Pikachu靶场:XSS盲打
  15. 基于verilog的数字频率计数器
  16. 九章算术 六:《均输》
  17. 聊聊什么是探索式测试
  18. 自适应波束形成(二)——时域窄带LCMV波束形成器
  19. python二级第三方库汇总
  20. 安装 VMware workstation

热门文章

  1. 机器学习项目模板:ML项目的6个基本步骤
  2. IJCAI 2020灭霸式拒稿,AI审稿是否更公平?
  3. 后深度学习时代的一大研究热点?论因果关系及其构建思路
  4. AI校招程序员最高薪酬曝光!腾讯80万年薪领跑,还送北京户口
  5. 面试官问:select......for update会锁表还是锁行?
  6. 0.2秒居然复制了100G文件?
  7. 线上出现死锁怎么解决?
  8. ZooKeeper 源码和实践揭秘
  9. 有人说 Maven 很简单,我却被 伤害 过
  10. 345 所开设人工智能本科专业高校名单大全