此处不打算解释具体用法,因为官方主页中有说明:

以及网上也有很多资料解释,具体是如何使用BeautifulSoup的。

此处只是记录,在使用过程中,遇到的一些问题,以及如何解决的,或者是使用时候,有哪些需要注意的事情。

1.关于不支持相关的问题

如果要解析的html中包含类似于:

等字样的字符串,此处3.0.6的BeautifulSoup会解析出错的。

具体相关解释去看:

2.不支持html中一些属性/字符的深度嵌套

如果解析的html中包含一些特殊的情况,比如

sina的一个博客帖子:

其html源码中包含这样的:。。。。。。。。。。。。。。。

那么此部分内容,就会解析失败。

此处我用了代码:# handle special case for http://blog.sina.com.cn/s/blog_5058502a01017j3j.html

processedHtml = processedHtml.replace('', "");

processedHtml = processedHtml.replace("", "");

去处理,然后再去解析,就可以了。

python处理HTML的函数库,【整理】关于Python中的html处理库函数BeautifulSoup使用注意事项...相关推荐

  1. [Python+Anaconda] 查看Python、Anaconda下python、CUDA、函数库的版本

    查看Python.Anaconda下Python.CUDA.函数库的版本 前言 第三方库(比如Pytorch)要依赖Python版本,CUDA版本,对于不同的版本组合,会有不同的安装命令. 这就要求我 ...

  2. [python八卦] zz 一位大牛整理的Python资源

    http://www.cnblogs.com/itech/archive/2009/12/15/1624120.html Python基本安装: * http://www.python.org/ 官方 ...

  3. 基于树莓派的python GPIO编程-常用函数综合整理

    Hello,朋友们大家好,欢迎大家来到LIUSE网络. 随着Mini型PC越来越多,与之而来的创客也丰富起来,比如说Arduino就是一个非常好里例子. 不过,Arduino毕竟是一块适合入门型的基础 ...

  4. python图像库_Python常用图像处理库整理

    1. 库简介 深度学习领域,对视频图片样本的处理占了很大一部分比重. 而Python环境下的图像处理库种类较多,无论是精度,速度等方面都有不同的差异,这里予以总结. Python环境下,相关的包有: ...

  5. [python+pip] 使用pip将函数库安装到Python环境或Anaconda环境

    Python函数库的安装方式 优先级1:pip安装或conda安装 优先级2:库的自定义安装 优先级3:库的文件安装(.whl文件) 下面介绍pip的使用 两个pip 在下载Anaconda之前,py ...

  6. python使用第三方函数库_Python(七)python下的内部函数库和第三方函数库

    返回脚本百事通 在dateutil中,吸引我的东西有2个,1个是parser,1个是rrule. 其中parser是根据字符串解析成datetime,而rrule是则是根据定义的规则来生成dateti ...

  7. python二次开发ug_Siemens NX (UG)中对于Python第三方包(函数库)的设置方法

    从NX 10开始,NX Open增加了对Python的支持,使得NX脚本语言的多元性进一步得到扩充.但对于大多数用户来说,选择Python作为脚本语言,主要是想利用Python社区提供的各种函数库或功 ...

  8. python中nx_Siemens NX (UG)中对于Python第三方包(函数库)的设置方法

    从NX 10开始,NX Open增加了对Python的支持,使得NX脚本语言的多元性进一步得到扩充.但对于大多数用户来说,选择Python作为脚本语言,主要是想利用Python社区提供的各种函数库或功 ...

  9. macbook自带python保存文件夹_在mac下查找python包存放路径site-packages的实现方法 在Mac系统下python如何安装第三方函数库?...

    mac怎么查看python的site-package位置世界上最伤心的事,不是你爱的人不爱你,而是他爱你过后,最后却不爱你. 可以通过find命令查看,参考demo如下: sudo find / -n ...

  10. python最好的五个库_5 个Python 库,照亮你的机器学习之路

    这些 Python 库帮助你加速数据传输,通过 AWS Lambda 对大型计算工作做碎片化处理,并使用略低于 TensorFlow 的模型工作. 机器学习令人兴奋,但具体工作复杂而困难.通常它涉及很 ...

最新文章

  1. php 7.0 编译安装mysql_源码编译安装php7.0.5
  2. 最全整理!Python 操作 Excel 库 xlrd与xlwt 常用操作详解!
  3. 对象间的联动——观察者模式
  4. QTP User-Defined Function 学习经验汇总
  5. pssh批量远程管理
  6. 小米9开售秒罄!系统更新:新增月亮拍照及运动跟拍模式
  7. 随想录(矩阵计算的几种方法)
  8. 特斯拉要用太阳能满足整座岛全年能源需求
  9. 如何把照片裁剪成证件照指定尺寸比例?
  10. Android手机开发总结
  11. 软件测试的六大测试质量标准
  12. [TF进阶] 卷积神经网络
  13. 电视盒子显示ntp服务器异常,云计算-更换VRM主节点所在服务器主板后,出现VRM与NTP服务器状态异常的处理方法...
  14. fanuc换刀宏程序详解_FANUC宏程序大全+实例讲解
  15. dojo框架的基本认识
  16. UIButton文字颜色无法修改的解决方法和知识拓展
  17. otsu阈值分割原理及实现
  18. win10下安装cuda和cudnn
  19. 如何替换android apk中的so
  20. 简阳市简阳中学2021年高考成绩查询,2021年简阳中学升学率怎么样?

热门文章

  1. C#判断一个string是否为数字 --zt
  2. 一天一个小技巧(4)——利用Python和MATLAB进行图片二值化
  3. Splash args 属性
  4. 面向对象程序设计 作业一
  5. 在django项目中使用django-ckeditor
  6. winform自定义用户控件
  7. 女学霸考692分想当“程序媛”,网友:快劝劝孩子
  8. ACL2020 | 什么时候值得用BERT上下文嵌入
  9. 一文详解自然语言处理任务之共指消解
  10. 2020年NLP算法秋招“神仙打架”,我该如何应对?