python使用ElementTree解析XML文件
一、将XML网页保存到本地
要加载XML文件首先应该将网页上的信息提取出来,保存为本地XML文件。抓取网页信息可以python的urllib模块。
代码如下:
from urllib import urlopen url = "http://********/**" resp = urlopen(url).read() f = open('文件保存路径', 'w') f.write(resp) f.close()
二、解析XML文件
python有许多可以用来解析XML文件的函数,在这里介绍ElementTree(简称ET).它提供轻量级的python式API。实现逻辑简单,解析效率高。利用ET解析XML文件的方法是:先找出父级标签,然后再一级一级循环找出所需要的子标签,代码如下:
import xml.etree.cElementTree as ET tree = ET.parse("***.xml") #加载xml文件 root = tree.getroot() #得到第二级标签 for child_of_root in root[1]:#root[1]为第二级标签中的第二个子标签 for child1 in child_of_root[7]: #原理同上for child2 in child1:print child2.tag, child2.attrib, child2.textfor child3 in child_of_root[8]:for child4 in child3:print child4.tag, child4.attrib, child4.text
在上述代码中,child_of_root[7]表示在该级标签中的第八个子标签,在for child2 in child1中是遍历child1的所有子标签,打印出子标签的名称、属性、文本。这样就可以将XML文件解析完成,得到我们所想要的信息。
转载于:https://www.cnblogs.com/l5623064/p/8574624.html
python使用ElementTree解析XML文件相关推荐
- python 使用ElementTree解析xml
python 使用ElementTree解析xml 本博客转载自:https://www.cnblogs.com/hupeng1234/p/7262371.html 昨天在做解析xml的工作,试了两种 ...
- python解析xml文件elementtree_在python中使用ElementTree解析xml文件
ElementTree是python自带的处理xml格式文件的模块,位于libxmletreeElementTree.py.这个模块有两个基本概念:Element和ElementTree. 表示整个树 ...
- python 使用sax 解析xml 文件
这里不是说xml 的所以如果xml 不了解,可以百度大致看下即可, SAX知识了解 SAX (simple API for XML ) 有解析器和事件处理器 解析器负责读取XML文档,并向事件处理器 ...
- python读取xml_python解析xml文件
加载和读取xml文件 import xml.dom.minidom doc = xml.dom.minidom.parse(xmlfile) 获取xml文档对象(对子节点和节点node都适用) roo ...
- Python ElementTree 解析 xml文件
文章目录 一.xml文件结构 二.基础解析 1.加载文档 2.获取根元素 3.根元素的属性 4.遍历其直接子元素 5.通过索引值来访问特定的子元素 查找需要的元素 三.支持通过XPath查找元素 四. ...
- 「Python」 ElementTree模块解析xml文件,建议小白阅读全文
背景 Python有三种方法解析xml:SAX,DOM,Elementree.本文记录ElementTree方法解析xml. 目前自己用的是Python3.6,但在该版本中并没有xml的缩进函数ET. ...
- python解析xml文件elementtree_Python中使用ElementTree解析XML示例
[XML基本概念介绍] XML 指可扩展标记语言(eXtensible Markup Language). XML 被设计用来传输和存储数据. 概念一: 复制代码 代码如下: # foo元素的起始标签 ...
- python解析xml文件elementtree_Python 用ElementTree读取XML文件
python有三种方法解析XML,SAX,DOM,以及ElementTree ###1.SAX (simple API for XML ) pyhton 标准库包含SAX解析器,SAX是一种典型的极为 ...
- python 解析xml格式_Python解析XML文件
1.概述 Python有三种方法解析XML:SAX,DOM,以及ElementTree: 1.SAX (simple API for XML ) python 标准库包含SAX解析器,SAX用事件驱动 ...
最新文章
- Windows客户端C/C++编程规范“建议”——指针
- python排名上升_Python在TIOBE Index排名或將取代Java成為第2名
- input添加disabled属性出现的移动端兼容问题
- 安全容器的发展与思考
- 刚开始学Web前端,用什么软件好?
- 【报错笔记】在maven项目中jsp页面使用window.location.href给controller传参时参数过长所以路径无法跳转至controller
- ibatis常用的集中判断语句
- Linux Mysql 安装方法
- SAP License:SAP中的成本核算模型(调侃版)
- leetcode python3 简单题169. Majority Element
- 用python做时间序列预测一:初识概念
- 编译Android源码:Exception in thread main java.lang.UnsupportedClassVersionError:报错解决
- [python]设计模式
- 微信小程序实现视频功能(二):视频列表与下载
- 多臂赌博机Multi-Armed Bandit(MAB)
- 为postgreSQL添加man帮助
- 打开secpol.msc、gpedit.msc显示“试图引用不存在的令牌”,复制到其他目录可正常打开
- 2023年安徽省中职网络安全跨站脚本攻击
- 电脑公司GHOST WIN7 装机旗舰版 2013 05
- 将SSH多次登录失败的IP加入黑名单
热门文章
- VS.Net 开发 MSN一样缓慢出来的提示信息的方法
- java发送jsp表格邮件_javaweb收发邮件 servler+jsp实现(一)
- Pycharm详细安装教程
- java比python难_python java JAVA比python难多少?
- 已知三角形三点坐标求角度_2019高考数学:解三角形——正弦定理和余弦定理的解题技巧和模型...
- Windows Server 2016离线安装.NET Framework 3.5
- maven + spring mvc 创建Java web项目
- 计算机视觉与深度学习 | 粒子群算法与遗传算法(GA)及与蚁群算法(ACO)比较
- 语音信号之特性分析图(二)
- 打豆豆游戏c语言编程,C语言程序打豆豆(函数版)