遇到一个编程问题,你必须首先想到的是要简化它,简化成一个最简单的问题后,写最简单的代码来解决它,同时只付出最简单的测试代价。

简单HTML源码:

1

23

提取上述代码中的注释:

from bs4 import BeautifulSoup, Comment

soup = BeautifulSoup("""1

23""")

comments = soup.findAll(text=lambda text:isinstance(text, Comment))

for comment in comments:

print comment

输出结果:

The loneliest number

Can be as bad as one

去掉上面HTML代码中的注释:

from bs4 import BeautifulSoup, Comment

soup = BeautifulSoup("""1

23""")

comments = soup.findAll(text=lambda text:isinstance(text, Comment))

[comment.extract() for comment in comments]

print soup

输出结果:

1

23

参考:

原文:http://my.oschina.net/ioslighter/blog/423166

删除html注释 python,用Python提取HTML源码中的注释与去掉注释相关推荐

  1. python简单代码加法-CPython 源码中整数加法的实现

    最近突然涌起兴趣去阅读 CPython 源码,网上也看了不少解析的文章,后来网上看到<Python源码剖析>评价不错,可惜现在已经绝版,只能从豆瓣阅读购买了一本电子书观摩 . 我从网上下载 ...

  2. Python内置函数的源码中方法只有pass占位符说明 Docs

    pass python定义函数,必须有函数体,否则编译就会报错.函数体用一句pass占位是防止报错,并且不会有任何动作.内置函数中使用pass的情况如下: 父类中声明函数,但不声明实现,由继承的子类进 ...

  3. python源码图片_初学者用python爬凡客图片的源码

    python学习最大的动力就是能写出一些可以运行的代码.感觉python真是的很强大. 下边的这部分python代码是我用来爬凡客T的图片,代码是初学阶段写的,比较简陋,没做修改,之前是可以用的.翻出 ...

  4. 使用Cython库包对python的py文件(源码)进行加密,把python的.py文件生成.so文件并调用

    文章目录: 1 准备环境 2 调用`Cython库包`把python的`.py`文件生成`.so`文件 2.1 写源码文件 2.2 调用源码接口 2.3 调用Cython库把`.py`源码生成`.so ...

  5. python字符串代码对象_Python源码剖析 - Python中的字符串对象

    1. 前言 我们已经在 [Python中的整数对象] 章节中对定长对象进行了详细的讲解,接下来我们将介绍变长对象,而字符串类型,则是这类对象的典型代表. 这里必须先引入一个概念: Python 中的变 ...

  6. Python wordcloud词云:源码分析及简单使用

    Python版本的词云生成模块从2015年的v1.0到现在,已经更新到了v1.7. 下载请移步至:https://pypi.org/project/wordcloud/ wordcloud简单应用: ...

  7. 【Python 笔记】Linux 下源码编译安装 python

    本文记录在 Linux 上源码编译安装 python 的过程. 文章目录 1. 源码编译安装说明 2. 安装 python2.7 3. 安装 python3.6 1. 源码编译安装说明 安装过程比我想 ...

  8. 分享Python采集77个VB源码,总有一款适合您

    分享Python采集77个VB源码,总有一款适合您 Python采集的77个VB源码下载链接:https://pan.baidu.com/s/15jH2rxm5RXt7g9uIUFxYhA?pwd=2 ...

  9. python影视数据爬虫sqlite源码+论文(完整版和简洁版)

    python影视数据爬虫sqlite源码+论文(完整版和简洁版)-99源码网,程序代做,代写程序代码,代写编程,代写Java编程,代写php编程,计算机专业代做,计算机毕业设计,网站建设,网站开发,程 ...

  10. Python 进阶:enum 模块源码分析

    作者:weapon 来源:https://zhuanlan.zhihu.com/p/52056538 起步 上一篇<Python 的枚举类型> (https://zhuanlan.zhih ...

最新文章

  1. python监控程序编写_05-python进阶-简单监控程序开发
  2. SQL Assistant v2.5.12 序列号
  3. c ++查找字符串_C ++类和对象| 查找输出程序| 套装1
  4. Horizon View 7 发布Win10桌面二:即时克隆桌面池配置
  5. datagrid sortname如何定义多列_如何实现一个小说分页的功能
  6. 江苏大学矩阵论、数理统计期末考试复习
  7. java参数传递时,究竟传递的是什么
  8. 管家婆 源码 php,在windows平台上构建本身的PHP
  9. 从Bezier到NURBS曲线(1) - Bezier曲线
  10. EVE-NG模拟器综合
  11. 全国计算机比赛微课视频,“教学之星”全国总决赛 | 冠军朱琦微课及现场比赛视频...
  12. 【被网上巨坑了】 win10+php5.6-ts-vc11-x64配置imagick的经历
  13. 乌班图系统设置系统语言,以及中文输入法
  14. [渝粤教育] 中央财经大学 宏观经济学 参考 资料
  15. 生活中的逻辑谬误02.稻草人谬误
  16. opencv学习日记
  17. 结构型模式-装饰者模式
  18. Spark集群运行xgboost4j-spark总结
  19. JavaCC中扩展的正规表达式
  20. java 去除引号_java如何用replaceAll去除字符串中的引号

热门文章

  1. eclipse报错Server Tomcat v7.0 Server at localhost failed to start.
  2. Java写入磁盘阵列_什么是RAID?RAID有什么用?RAID原理
  3. STC学习:可切换内容的电子音乐
  4. c/c++基础篇--------------------------数据类型与变量类型
  5. python装饰器打印函数执行时间_使用python装饰器计算函数运行时间的实例
  6. jmeter录制脚本_jmeter(二)Badboy录制脚本
  7. 用计算机数字语言研究中医理论,试论中医基础理论数字模型.pdf
  8. (void) (_x == _y)
  9. php检索特定的关键字的函数,javascript、php关键字搜索函数的使用方法
  10. 机器学习XGBoost 算法概述