假设被注释代码段如下:

html="""

"""

如果直接对此代码段使用pyquery转换并提取

from pyquery import PyQuery as pq

response = pq(html)("div.forum_content")

print(response)

会报错:lxml.etree.ParserError: Document is empty

方法:利用bs4提取被注释代码段,再使用pyquery转换并提取

from pyquery import PyQuery as pq

from bs4 import BeautifulSoup,Comment

soup = BeautifulSoup(html,'html.parser')

res = ''.join(soup.findAll(text=lambda text:isinstance(text,Comment))) # 提取被注释部分

response = pq(res)("div.forum_content")

print(response)

结果:可被正常提取

如何注释python中html,Python在HTML中提取带注释的代码,python,html,被相关推荐

  1. python中布尔变量的值为_python 布尔操作实现代码 python是如何定义并使用变量的...

    python中怎么定义一个布尔类型的变量我要记住这一个半小时的车程,我要记住每一个红灯和颠簸,我要记住你手臂的温度.甚至希望旅途变长,天色变暗,暴雨如注,可与你再度过一个夜晚. 直接定义a=True/ ...

  2. python 图像卷积_[卷积神经网络(CNN)中的卷积核到底是如何提取图像特征的(python实现图像卷积运算)]...

    1.前言 我们知道,卷积核(也叫滤波器矩阵)在卷积神经网络中具有非常重要的作用.说白了,CNN主要作用在于提取图像的各种特征图(feature maps). CNN主要是通过卷积运算来完成特征提取的. ...

  3. python形参和实参同名_一道题带你搞定Python函数中形参和实参问题

    昨天在Python学习群里有位路人甲问了个Python函数中关于形参和实参一个很基础的问题,虽然很基础,但是对于很多小白来说不一定简单,反而会被搞得稀里糊涂.人生苦短,我用Python. 为了解答大家 ...

  4. python怎么写测试脚本语言_手把手带你,用Python写一个Monkey自动化测试脚本!!!...

    一.为什么需要一个测试脚本? 之前讲解了 Android Monkey 命令的使用方式,今天趁着还热乎就手把手用 Monkey 写一个压力测试的脚本.还不了解什么是 Monkey 的,可以看看之前的文 ...

  5. python 包和模块的区别_3分钟带你搞懂Python模块、包的区别和使用

    一.模块和包的定义 模块的定义:任何*.py 的文件都可以当作模块使用import 导入 包的定义:包含一个__init__.py和其他模块.其他子包的一个目录 实际项目中,所谓的包和模块分别代表什么 ...

  6. python教学视频a_2019何老师一个月带你玩转Python分布式爬虫实战教程视频(视频+源码)...

    ├─章节1-爬虫前奏(官网免费) │ 001.爬虫前奏_什么是网络爬虫.mp4 │ 002.爬虫前奏_HTTP协议介绍.mp4 │ 003.爬虫前奏_抓包工具的使用网络请求.mp4 │ ├─章节2-网 ...

  7. python django web典型模块开发实战_带你读《Python Django Web典型模块 开发实战》之一:从新浪微博聊起多端应用-阿里云开发者社区...

    Python Django Web典型模块 开发实战 点击查看第二章 点击查看第三章 寇雪松 编著 第1章 从新浪微博聊起多端应用 当人们听到"新浪",脑海里第一个浮现的关联词是& ...

  8. python 实现 PC端剪映字幕转换SRT格式工具代码-Python 实现

    #encoding:utf-8 import json import time import datetime import os import socket import getpassuser_n ...

  9. 使用Python实现从CAD中选择多段线并提取坐标

    使用Python实现从CAD中选择多段线并提取坐标 直接上代码案例 import pythoncom import win32com.clientdef vtpnt(x, y, z=0):return ...

最新文章

  1. 【数据库】兴唐第二十七节课之jdbc的使用
  2. 这才是最好的程序语言,不服来辩
  3. numpy基本矩阵操作
  4. Asp.net中的Cache--HttpRuntim.Cache 和 HttpContext.Current.Cache
  5. 给C#开发者的代码审查清单
  6. 如何保证NFS文件锁的一致性?
  7. [蓝桥杯][2014年第五届真题]分糖果-模拟
  8. JAVA构架之并发编程的一些总结
  9. es6 yield表达式
  10. 单链表的尾插,头插,遍历,查找和插入
  11. 旧的非flash版Metalink的入口
  12. linux mmu的实现的讲解_Linux_MMU
  13. 黑色的php编辑器,五款常用的免费php编辑器推荐
  14. 2022-2028年全球与中国基于汽车摄像头的ADAS行业深度分析
  15. java kindeditor ssh,typecho KindEditor插件
  16. petalinux - 修改fsbl
  17. 双足机器人课设报告_双足竞步机器人-智能步行者设计-技术报告
  18. 体验APP时的必答题—以扇贝单词为例
  19. 【总目录】人工智能、机器学习、深度学习总结大全----目录.未完待续...
  20. CentOS8安装后切换桌面

热门文章

  1. 快速入门容器服务,创建Kubernetes集群
  2. 一个周内上线50个增长策略,竟然能这么高效!
  3. 从310到蚂蚁森林,蚂蚁金服在线图计算的创新与实践
  4. Apache Cassandra static column 介绍与实战
  5. 阿里云容器技术专家莫源:乘风踏雪归来,仍是此间少年
  6. 看不见的战斗——阿里云护航世界杯直播容灾实践
  7. 一文看清深圳云栖阿里云重磅产品发布
  8. 服务器之后加码存储,浪潮信息重磅发布新一代 G6 存储平台
  9. Mendix入局中国低代码,开发者们你准备好了吗
  10. 今天下午三点,2020深圳开放数据应用创新大赛将举行第二场线上推介会