一、将XML网页保存到本地


要加载XML文件首先应该将网页上的信息提取出来,保存为本地XML文件。抓取网页信息可以python的urllib模块。

代码如下:

from urllib import urlopen
url = "http://********/**"
resp = urlopen(url).read()
f = open('文件保存路径', 'w')
f.write(resp)
f.close()

二、解析XML文件

python有许多可以用来解析XML文件的函数,在这里介绍ElementTree(简称ET).它提供轻量级的python式API。实现逻辑简单,解析效率高。利用ET解析XML文件的方法是:先找出父级标签,然后再一级一级循环找出所需要的子标签,代码如下:

import xml.etree.cElementTree as ET
tree = ET.parse("***.xml")  #加载xml文件
root = tree.getroot()  #得到第二级标签
for child_of_root in root[1]:#root[1]为第二级标签中的第二个子标签 for child1 in child_of_root[7]: #原理同上for child2 in child1:print child2.tag, child2.attrib, child2.textfor child3 in child_of_root[8]:for child4 in child3:print child4.tag, child4.attrib, child4.text

在上述代码中,child_of_root[7]表示在该级标签中的第八个子标签,在for child2 in child1中是遍历child1的所有子标签,打印出子标签的名称、属性、文本。这样就可以将XML文件解析完成,得到我们所想要的信息。

转载于:https://www.cnblogs.com/l5623064/p/8574624.html

python使用ElementTree解析XML文件相关推荐

  1. python 使用ElementTree解析xml

    python 使用ElementTree解析xml 本博客转载自:https://www.cnblogs.com/hupeng1234/p/7262371.html 昨天在做解析xml的工作,试了两种 ...

  2. python解析xml文件elementtree_在python中使用ElementTree解析xml文件

    ElementTree是python自带的处理xml格式文件的模块,位于libxmletreeElementTree.py.这个模块有两个基本概念:Element和ElementTree. 表示整个树 ...

  3. python 使用sax 解析xml 文件

    这里不是说xml 的所以如果xml 不了解,可以百度大致看下即可, SAX知识了解 SAX (simple API for XML )  有解析器和事件处理器 解析器负责读取XML文档,并向事件处理器 ...

  4. python读取xml_python解析xml文件

    加载和读取xml文件 import xml.dom.minidom doc = xml.dom.minidom.parse(xmlfile) 获取xml文档对象(对子节点和节点node都适用) roo ...

  5. Python ElementTree 解析 xml文件

    文章目录 一.xml文件结构 二.基础解析 1.加载文档 2.获取根元素 3.根元素的属性 4.遍历其直接子元素 5.通过索引值来访问特定的子元素 查找需要的元素 三.支持通过XPath查找元素 四. ...

  6. 「Python」 ElementTree模块解析xml文件,建议小白阅读全文

    背景 Python有三种方法解析xml:SAX,DOM,Elementree.本文记录ElementTree方法解析xml. 目前自己用的是Python3.6,但在该版本中并没有xml的缩进函数ET. ...

  7. python解析xml文件elementtree_Python中使用ElementTree解析XML示例

    [XML基本概念介绍] XML 指可扩展标记语言(eXtensible Markup Language). XML 被设计用来传输和存储数据. 概念一: 复制代码 代码如下: # foo元素的起始标签 ...

  8. python解析xml文件elementtree_Python 用ElementTree读取XML文件

    python有三种方法解析XML,SAX,DOM,以及ElementTree ###1.SAX (simple API for XML ) pyhton 标准库包含SAX解析器,SAX是一种典型的极为 ...

  9. python 解析xml格式_Python解析XML文件

    1.概述 Python有三种方法解析XML:SAX,DOM,以及ElementTree: 1.SAX (simple API for XML ) python 标准库包含SAX解析器,SAX用事件驱动 ...

最新文章

  1. Windows客户端C/C++编程规范“建议”——指针
  2. python排名上升_Python在TIOBE Index排名或將取代Java成為第2名
  3. input添加disabled属性出现的移动端兼容问题
  4. 安全容器的发展与思考
  5. 刚开始学Web前端,用什么软件好?
  6. 【报错笔记】在maven项目中jsp页面使用window.location.href给controller传参时参数过长所以路径无法跳转至controller
  7. ibatis常用的集中判断语句
  8. Linux Mysql 安装方法
  9. SAP License:SAP中的成本核算模型(调侃版)
  10. leetcode python3 简单题169. Majority Element
  11. 用python做时间序列预测一:初识概念
  12. 编译Android源码:Exception in thread main java.lang.UnsupportedClassVersionError:报错解决
  13. [python]设计模式
  14. 微信小程序实现视频功能(二):视频列表与下载
  15. 多臂赌博机Multi-Armed Bandit(MAB)
  16. 为postgreSQL添加man帮助
  17. 打开secpol.msc、gpedit.msc显示“试图引用不存在的令牌”,复制到其他目录可正常打开
  18. 2023年安徽省中职网络安全跨站脚本攻击
  19. 电脑公司GHOST WIN7 装机旗舰版 2013 05
  20. 将SSH多次登录失败的IP加入黑名单

热门文章

  1. VS.Net 开发 MSN一样缓慢出来的提示信息的方法
  2. java发送jsp表格邮件_javaweb收发邮件 servler+jsp实现(一)
  3. Pycharm详细安装教程
  4. java比python难_python java JAVA比python难多少?
  5. 已知三角形三点坐标求角度_2019高考数学:解三角形——正弦定理和余弦定理的解题技巧和模型...
  6. Windows Server 2016离线安装.NET Framework 3.5
  7. maven + spring mvc 创建Java web项目
  8. 计算机视觉与深度学习 | 粒子群算法与遗传算法(GA)及与蚁群算法(ACO)比较
  9. 语音信号之特性分析图(二)
  10. 打豆豆游戏c语言编程,C语言程序打豆豆(函数版)