HTMLParser模块怎么在python中使用

发布时间:2021-02-09 09:29:29

来源:亿速云

阅读:82

作者:Leah

今天就跟大家聊聊有关HTMLParser模块怎么在python中使用,可能很多人都不太了解,为了让大家更加了解,小编给大家总结了以下内容,希望大家根据这篇文章可以有所收获。

安装:npm install htmlparser

htmlparser提供构造函数:function Parser(handler) {

this._handler = handler;

}

HTMLParser解析HTML:from html.parser import HTMLParser

from html.entities import name2codepoint

class MyHTMLParser(HTMLParser):

def handle_starttag(self, tag, attrs):

print('' % tag)

def handle_endtag(self, tag):

print('%s>' % tag)

def handle_startendtag(self, tag, attrs):

print('' % tag)

def handle_data(self, data):

print(data)

def handle_comment(self, data):

print('')

def handle_entityref(self, name):

print('&%s;' % name)

def handle_charref(self, name):

print('%s;' % name)

parser = MyHTMLParser()

parser.feed('''

Some html HTML tutorial...
END

''')

HTML本质上是XML的子集,但是HTML的语法没有XML那么严格,大家也可以尝试利用HTMLParser解析HTML。

知识点扩展:

常用方法介绍

l feed(data):主要用于接受带html标签的str,当调用这个方法时并提供相应的data时,整个实例(instance)开始执行,结束执行close()。

l handle_starttag(tag, attrs):这个方法接收Parse_starttag返回的tag和attrs,并进行处理,处理方式通常由使用者进行覆盖,本身为空。

例如,连接的start tag是,那么对应的参数tag='a'(小写)。attrs是start tag <>中的属性,以元组形式(name, value)返回(所有这些内容都是小写)。

例如,对于

python htmlparser怎么用_HTMLParser模块怎么在python中使用相关推荐

  1. python哪个关键字可以导入模块_关于python导入模块import与常见的模块详解

    0.什么是python模块?干什么的用的? Java中如果使用abs()函数,则需要需要导入Math包,同样python也是封装的,因为python提供的函数太多,所以根据函数的功能将其封装在不同的m ...

  2. python如何查看有什么模块_在python中如何查看模块功能

    在python中查看模块功能的方法:1.在python命令行输入help()函数进入help帮助文档界面:2.键入[modules]列出当前所有安装的模块:3.键入相应的模块名称即可得到该模块的功能信 ...

  3. c调用python代码找不到模块_构建 Python C 扩展模块

    有好几种扩展 Python 的功能的方法.其中一种就是用 C 或 C++ 编写 Python 模块.通过这个过程可以提高性能,更好地访问 C 库函数和系统调用.在本教程中,我将带大家了解如何使用 Py ...

  4. python英译汉库模块_翻译|Python标准功能库1

    上班的时候偷懒,把Python帮助里的标准功能库1过了一遍,顺便翻译了一下,虽然我知道基本没有人看,但不是说21世纪编程能力是基本的生存力嘛. 通过阅读本文,你将了解Python的11个标准功能库1. ...

  5. 一个完整的python文件即是一个模块_用python玩转数据|基本语法

    比较运算符 >>>3<4<7 True >>>3<4<1 False >>> 打开文件 >>> f=op ...

  6. 一个完整的python文件即是一个模块_用Python玩转数据:python的函数、模块和包

    标签: Python函数 函数可以看成类似于数学中的函数,完成一个特定功能的一段代码. -绝对值函数 abs() -类型函数 type() -四舍五入函数 round() Python中有很多内建函数 ...

  7. python调用jar包的模块_使用 Python 的 JPype 模块调用 Jar 包

    背景与需求 最近学习并安装使用了HttpRunner框架去尝试做接口测试,并有后续在公司推广的打算. HttpRunner由Python开发,调用接口时需要依赖Python:而大多数公司的扩展工具包使 ...

  8. python解析html用哪个模块_[转载]python模块学习---HTMLParser(解析HTML文档元素)

    HTMLParser是Python自带的模块,使用简单,能够很容易的实现HTML文件的分析. 本文主要简单讲一下HTMLParser的用法. 使用时需要定义一个从类HTMLParser继承的类,重定义 ...

  9. python导入自己写的模块_大话python模块导入

    对于完成一些简单任务的程序我们编写一个源文件是可以的,但对于稍微复杂点的程序或大型程序时,我们往往需要把这个复杂任务按照一定的规则拆分成多个python文件来实现,最后再把多个文件组合在一起就可以了, ...

最新文章

  1. 2022-2028年中国手术室设备行业市场研究及前瞻分析报告
  2. 【Tensorflow】tf.map_fn() 使用过程中遇到【inf, NaN】报错问题
  3. Java开发高性能网站需要关注的事
  4. live555编译、播放示例
  5. python和java哪个好-现在Java和Python哪个前景更好?
  6. autocad完全应用指南_北京博超时代软件有限公司软件SQL安装指南
  7. 我的世界Java版最大村庄_《我的世界》MC中最大的村庄种子,PC和PE都可以用
  8. 什么是高精准IP地址定位——IP问问
  9. 软件验收报告文档模版
  10. 抢购器 抢拍器 秒杀器 秒杀软件 抢购软件 设计思路(未实现)
  11. 网吧服务器常用设置维护工具,某某网吧专用维护工具
  12. 纵列式双旋翼直升机飞行控制律建模
  13. HTML+CSS+JS 01篇
  14. Google Play 下载 apk
  15. UltraEdit+Masm--打造自己的汇编IDE
  16. Android 发布代码到github 并且部署到 JitPack maven 仓库详细步骤
  17. Win7下安装Ubuntu16.04成双系统
  18. FLASK RESTFUL TOKEN用户验证笔记
  19. 崩坏3服务器维护什么时候维护好,崩坏3 11月1日更新了什么_维护到什么时候结束...
  20. 上市P2P转型电商:和信贷推会员制购物平台,前车之鉴今犹在

热门文章

  1. 毕业后第一份工作的工作总结_我是如何获得第一份开发工作的,以及接下来的工作...
  2. Google优化工具Timeline的使用(Chrome 57已经改为performance(性能模板))
  3. 计算机叫醒服务英语,关于叫醒服务的英语对话
  4. 墨菲安全在IDEA中的使用
  5. 仿微信UI5.4 (三)
  6. MacType你用过么
  7. NOI 1.5 45
  8. deepin LInux 安装星火商店
  9. mysql tmpfs_tmpfs:一种基于内存的文件系统
  10. 摄像头连接到计算机步骤,电脑如何连接摄像头 摄像头连接笔记本电脑的详细步骤...