python xml处理 xml内容提取
针对XML文件形如:
<某某某><Doc ID="1"><Sentence ID="1">111——111</Sentence></Doc><Doc ID="2"><Sentence ID="1">222——111</Sentence><Sentence ID="2">222——222</Sentence></Doc>
目标:输出每一句话
代码:
name='XML文件名称'
f=open(name+".txt","w",encoding='utf-8')
DOMTree = xml.dom.minidom.parse(name+".xml")
Data = DOMTree.documentElement
docs = Data.getElementsByTagName("Doc")
for doc in docs:
# if doc.hasAttribute("ID"):
# print ("ID: %s" % doc.getAttribute("ID")) sens = doc.getElementsByTagName('Sentence')for sen in sens:s=sen.childNodes[0].dataprint(s)f.write(s)f.write('\n')
f.close()
搞定!
python xml处理 xml内容提取相关推荐
- Python即时网络爬虫项目: 内容提取器的定义(Python2.7版本)
1. 项目背景 在Python即时网络爬虫项目启动说明中我们讨论一个数字:程序员浪费在调测内容提取规则上的时间太多了(见上图),从而我们发起了这个项目,把程序员从繁琐的调测规则中解放出来,投入到更高端 ...
- python爬虫程序的流程图_Python即时网络爬虫项目: 内容提取器的定义(Python2.7版本)...
###1. 项目背景 在Python即时网络爬虫项目启动说明中我们讨论一个数字:程序员浪费在调测内容提取规则上的时间太多了(见上图),从而我们发起了这个项目,把程序员从繁琐的调测规则中解放出来,投入到 ...
- python网络爬虫的项目背景_第四章 Python即时网络爬虫项目: 内容提取器的定义
1. 项目背景 在python即时网络爬虫项目启动说明中我们讨论一个数字:程序员浪费在调测内容提取规则上的时间,从而我们发起了这个项目,把程序员从繁琐的调测规则中解放出来,投入到更高端的数据处理工作中 ...
- python etree创建xml_利用 Python ElementTree 生成 xml的实例
Python 处理 xml 文档的方法有很多,除了经典的 sax 和 dom 之外,还有一个 ElementTree. 首先 import 之: from xml.etree import Eleme ...
- 用python可以处理xml文件怎么打开_Python大神都是这样处理xml文件的!
最近有同学询问如何利用 Python 处理 xml 文件,特此整理一个比较简洁的操作手册,供大家参阅. 首先准备一个xml文件,xml中的内容如下所示.存储为:student.xml 如果要获取这个x ...
- pythonxml库_对python 生成拼接xml报文的示例详解
最近临时工作要生成xml报名,通过MQ接口发送.简单小程序. 自增长拼成xml报文 Test_001.py # encoding=utf-8 import time orderId = '' s1= ...
- delphi读取xml中的内容property name传递参数_Python 进阶知识全篇-XML 解析
什么是 XML? XML 指可扩展标记语言(eXtensible Markup Language),标准通用标记语言的子集,是一种用于标记电子文件使其具有结构性的标记语言. 你可以通过本站学习 XML ...
- IP得到天气预报(3)———XML中CDATA的提取
上一个Session中,我们可以得到其中的部分信息了.也就是说,如果你自己看的话,就会发现雅虎的天气中,这样读取XML我们也只能得到相应的最低温度,最高温度.或者明天的,或者今天的湿度风速.这是东西都 ...
- python专题-读取xml文件
关于python读取xml文章很多,但大多文章都是贴一个xml文件,然后再贴个处理文件的代码.这样并不利于初学者的学习,希望这篇文章可以更通俗易懂的教如何使用python 来读取xml 文件. 什么是 ...
- Python 标准库 —— xml
什么是 xml? xml:eXtensible Markup Language,即可扩展标记语言,它可以用来标记数据/定义数据类型,是一种允许用户对自己的标记语言进行定义的源语言. // abc.xm ...
最新文章
- ADB 查看 crash log
- Animation Override Controller动画重载器
- 公有/私有/保护继承、overload/overwrite/override之间的区别
- 计算机视觉库OpenCV之saturate_cast防数据越界函数
- 从明面上学习ASP.NET Core
- c语言qt生成dll与加载dll,Qt制作界面的DLL以及调用
- 退火算法 贪婪算法_算法贪婪策略简介
- 求带权中位数的Select算法
- 虎牙游戏直播基于php swoole,centos6.8 php7+swoole 实现赛事直播系统
- 学习 ASP.NET MVC (第二回)实战篇
- 计算机组成原理 第一章 计算机系统概述
- 《设计模式系列》---备忘录模式
- Atitit 企业战略目标的艺术 目录 1. 企业战略目标	1 2. 特点 ▪ 宏观性 ▪ 长期性 ▪ 全面性 稳定性	1 3. 内容	2 3.1. 彼得·德鲁克在《管理实践》一书中提出了八个
- 长文预警-超详细的熊猫烧香病毒分析_00
- cad2010多个文件并排显示_CAD软件同时显示两张或多张图纸的方法
- 易语言_酷Q机器人插件_01
- 僵尸启示录开始 Scheming Through Ep1 Mac游戏介绍
- php storm netbean,的Android R.drawable找不到符号...(使用netbean)
- java.sql.SQLException: The server time zone value '�й���ʱ��' is unrecognized or represents more tha
- Python 元组大全