Overview

这篇博客内容将包括对XML文件的解析、追加新元素后写入到XML,以及更新原XML文件中某结点的值。使用的是python的xml.dom.minidom包,详情可见其官方文档:xml.dom.minidom官方文档。全文都将围绕以下的customer.xml进行操作:

<?xml version="1.0" encoding="utf-8" ?>

Acme Inc.

12345

Regular customer since 1995

Star Wars Inc.

23456

A small but healthy company.

CDATA:在XML中,不会被解析器解析的部分数据。

声明:在本文中,结点和节点被视为了同一个概念,你可以在全文的任何地方替换它,我个人感觉区别不是很大,当然,你也可以看做是我的打字输入错误。

1. 解析XML文件

在解析XML时,所有的文本都是储存在文本节点中的,且该文本节点被视为元素结点的子结点,例如:2005,元素节点 ,拥有一个值为 “2005” 的文本节点,“2005” 不是 元素的值,最常用的方法就是getElementsByTagName()方法了,获取到结点后再进一步根据文档结构解析即可。

具体的理论就不过多描述,配合上述XML文件和下面的代码,你将清楚的看到操作方法,下面的代码执行的工作是将所有的结点名称以及结点信息输出一下:

# -*- coding: utf-8 -*-

"""

@Author : LiuZhian

@Time : 2019/4/24 0024 上午 9:19

@Comment :

"""

from xml.dom.minidom import parse

def readXML():

domTree = parse("./customer.xml")

# 文档根元素

rootNode = domTree.documentElement

print(rootNode.nodeName)

# 所有顾客

customers = rootNode.getElementsByTagName("customer")

print("****所有顾客信息****")

for customer in customers:

if customer.hasAttribute("ID"):

print("ID:", customer.getAttribute("ID"))

# name 元素

name = customer.getElementsByTagName("name")[0]

print(name.nodeName, ":", name.childNodes[0].data)

# phone 元素

phone = customer.getElementsByTagName("phone")[0]

print(phone.nodeName, ":", phone.childNodes[0].data)

# comments 元素

comments = customer.getElementsByTagName("comments")[0]

print(comments.nodeName, ":", comments.childNodes[0].data)

if __name__ == '__main__':

readXML()

2. 写入XML文件

在写入时,我觉得可分为两种方式:

新建一个全新的XML文件

在已有XML文件基础上追加一些元素信息

至于以上两种情况,其实创建元素结点的方法类似,你必须要做的都是先创建/得到一个DOM对象,再在DOM基础上创建new一个新的结点。

如果是第一种情况,你可以通过dom=minidom.Document()来创建;如果是第二种情况,直接可以通过解析已有XML文件来得到dom对象,例如dom = parse("./customer.xml")

在具体创建元素/文本结点时,你大致会写出像以下这样的“四部曲”代码:

①创建一个新元素结点createElement()

②创建一个文本节点createTextNode()

③将文本节点挂载元素结点上

④将元素结点挂载到其父元素上。

现在,我需要新建一个customer节点,信息如下:

kavin

32467

A small but healthy company.

代码如下:

def writeXML():

domTree = parse("./customer.xml")

# 文档根元素

rootNode = domTree.documentElement

# 新建一个customer节点

customer_node = domTree.createElement("customer")

customer_node.setAttribute("ID", "C003")

# 创建name节点,并设置textValue

name_node = domTree.createElement("name")

name_text_value = domTree.createTextNode("kavin")

name_node.appendChild(name_text_value) # 把文本节点挂到name_node节点

customer_node.appendChild(name_node)

# 创建phone节点,并设置textValue

phone_node = domTree.createElement("phone")

phone_text_value = domTree.createTextNode("32467")

phone_node.appendChild(phone_text_value) # 把文本节点挂到name_node节点

customer_node.appendChild(phone_node)

# 创建comments节点,这里是CDATA

comments_node = domTree.createElement("comments")

cdata_text_value = domTree.createCDATASection("A small but healthy company.")

comments_node.appendChild(cdata_text_value)

customer_node.appendChild(comments_node)

rootNode.appendChild(customer_node)

with open('added_customer.xml', 'w') as f:

# 缩进 - 换行 - 编码

domTree.writexml(f, addindent=' ', encoding='utf-8')

if __name__ == '__main__':

writeXML()

3. 更新XML文件

在更新XML时,只需先找到对应的元素结点,然后将其下的文本结点或属性取值更新即可,然后保存到文件,具体我就不多说了,代码中我将思路都注释清楚了,如下:

def updateXML():

domTree = parse("./customer.xml")

# 文档根元素

rootNode = domTree.documentElement

names = rootNode.getElementsByTagName("name")

for name in names:

if name.childNodes[0].data == "Acme Inc.":

# 获取到name节点的父节点

pn = name.parentNode

# 父节点的phone节点,其实也就是name的兄弟节点

# 可能有sibNode方法,我没试过,大家可以google一下

phone = pn.getElementsByTagName("phone")[0]

# 更新phone的取值

phone.childNodes[0].data = 99999

with open('updated_customer.xml', 'w') as f:

# 缩进 - 换行 - 编码

domTree.writexml(f, addindent=' ', encoding='utf-8')

if __name__ == '__main__':

updateXML()

如有不对之处,还烦请指教~

补充知识:python 读取xml文件内容并完成修改

我就废话不多说了,还是直接看代码吧!

import os

import xml.etree.ElementTree as ET

def changesku(inputpath):

listdir = os.listdir(inputpath)

for file in listdir:

if file.endswith('xml'):

file = os.path.join(inputpath,file)

tree = ET.parse(file)

root = tree.getroot()

for object1 in root.findall('object'): #我要修改的元素在object里面,所以需要先找到object

for sku in object1.findall('name'): #查找想要修改的所有同种元素

if (sku.text == '005'): #‘005'为原始的text

sku.text = '008' #修改‘name'的标签值

tree.write(file,encoding='utf-8') #写进原始的xml文件,不然修改就无效,‘encoding = “utf - 8”'避免原始xml #中文字符乱码

else:

pass

else:

pass

if __name__ == '__main__':

inputpath = 'D:\\easy\\hebing_xml' #这是xml文件的文件夹的绝对地址

changesku(inputpath)

以上这篇python解析xml文件方式(解析、更新、写入)就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持我们。

本文标题: python解析xml文件方式(解析、更新、写入)

本文地址: http://www.cppcns.com/jiaoben/python/302261.html

python xml 解析_python解析xml文件方式(解析、更新、写入)相关推荐

  1. python json解析_python读取json文件并解析

    原博文 2018-07-09 18:35 − # -*- coding: utf-8 -*- import os import json import sys reload(sys) sys.setd ...

  2. pythonxml解析_python之XML解析

    XML 指可扩展标记语言,标准通用标记语言的子集,是一种用于标记电子文件使其具有结构性的标记语言. XML 被设计用来传输和存储数据.XML适用于跟踪中小型数据而无需基于SQL的主干. Python ...

  3. 好用的python打包软件_Python打包exe文件方法汇总【4种】

    title: Python打包exe文件方法 copyright: true top: 0 date: 2018-08-11 21:08:21 tags: 打包 categories: Python进 ...

  4. python模块实例化_python中zipfile模块实例化解析

    文章内容由--"脚本之家"--提供,在此感谢脚本之家的贡献,该网站网址为:https://www.jb51.net/ 简介: zipfile是python里用来做zip格式编码的压 ...

  5. python rtsp推流_python处理RSTP视频流过程解析

    python处理RSTP视频流过程解析 这篇文章主要介绍了python处理RSTP视频流过程解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下 py ...

  6. python 参数解析_python的函数对参数解析分析

    以下转自其它博客.觉得总结得太好了,所以拿来自己参考一下. python中函数参数的传递是通过赋值来传递的. 函数参数的使用又有俩个方面值得注意: 1.函数参数是如何定义的 2.在调用函数的过程中参数 ...

  7. python动态映射_Python Django框架url反向解析实现动态生成对应的url链接示例

    本文实例讲述了Python Django框架url反向解析实现动态生成对应的url链接.分享给大家供大家参考,具体如下: url反向解析:根据url路由规则,动态生成对应的url链接 (防止硬编码). ...

  8. python成语填空_python一步一步解析成语

    做NLPproject时需要一个成语库,我需要的是纯成语,网上找的都是有详细解释的.于是自己写了一个爬成语的python程序. 1.首先找到一个在线成语网站 我选的网站是http://chengyu. ...

  9. python argparse模块_Python argparse模块应用实例解析

    这篇文章主要介绍了Python argparse模块应用实例解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下 简介 argparse是python ...

  10. python切片迭代_Python高级特性 切片 迭代解析

    切片:方便截取list.tuple.字符串部分索引的内容 正序切片 语法:dlist = doList[0:3]表示,从索引0开始取,直到索引3为止,但不包括索引3.即索引0,1,2,正好是3个元素 ...

最新文章

  1. 马来西亚拟对打车软件巨头Grab罚款2000万美元
  2. 一文让你秒懂AQS,附带源码剖析!
  3. 【年终总结】2019年有三AI知识星球做了什么,明年又会做什么
  4. python决策树可视化_「决策树」| Part3—Python实现之可视化
  5. matlab正弦光栅,科学网—光栅-正弦,矩形 - 宗兆玉的博文
  6. python获取电脑几核几线程_python编程测试电脑开启最大线程数实例代码
  7. js 的 math 函数
  8. AutoIt: WinGetClassList可以把当前窗口所有的handle全部列出来
  9. Flink on Zeppelin 流计算处理最佳实践
  10. 计算机网络7种类型,OSPF中7种类型LSA
  11. 130分的计算机专科学校排名及分数线,2021专科学校排名及分数线是多少
  12. myEclipse怎样将程序部署到tomcat(附录MyEclipse调试快捷键)
  13. if vue 跳出_vue实现弹框遮罩点击其他区域弹框关闭及v-if与v-show的区别介绍
  14. Jquery实现鼠标双击Table单元格变成文本框
  15. Linux中进程正常退出return和exit()的区别
  16. js字符串转json, json转字符串
  17. Minecraft Mod 开发:0-前言
  18. 【机器学习|数学基础】Mathematics for Machine Learning系列之矩阵理论(18):方阵的幂级数
  19. VMware安装Android x86_64 9.0虚拟机
  20. AI元宇宙数字人直播带货软件 全天24小时直播带货系统 含搭建教程

热门文章

  1. Python并发机制的实现(一)——多进程
  2. 温习SQL server
  3. MVC之使用Nhibernate
  4. The Unsolvable Problem
  5. jmake 编译当前目录所有c/c++单文件
  6. 架构如何为业务和技术“服务”(2)
  7. [转]js中escape,encodeURI,encodeURIComponent三个函数的区别
  8. QGroundControl实现多机控制
  9. 华为非对等通信小实验
  10. 向一个文件中写入字符,可以规定每行字数