针对XML文件形如:

<某某某><Doc ID="1"><Sentence ID="1">111——111</Sentence></Doc><Doc ID="2"><Sentence ID="1">222——111</Sentence><Sentence ID="2">222——222</Sentence></Doc>

目标:输出每一句话
代码:

name='XML文件名称'
f=open(name+".txt","w",encoding='utf-8')
DOMTree = xml.dom.minidom.parse(name+".xml")
Data = DOMTree.documentElement
docs = Data.getElementsByTagName("Doc")
for doc in docs:
#     if doc.hasAttribute("ID"):
#         print ("ID: %s" % doc.getAttribute("ID")) sens = doc.getElementsByTagName('Sentence')for sen in sens:s=sen.childNodes[0].dataprint(s)f.write(s)f.write('\n')
f.close()

搞定!

python xml处理 xml内容提取相关推荐

  1. Python即时网络爬虫项目: 内容提取器的定义(Python2.7版本)

    1. 项目背景 在Python即时网络爬虫项目启动说明中我们讨论一个数字:程序员浪费在调测内容提取规则上的时间太多了(见上图),从而我们发起了这个项目,把程序员从繁琐的调测规则中解放出来,投入到更高端 ...

  2. python爬虫程序的流程图_Python即时网络爬虫项目: 内容提取器的定义(Python2.7版本)...

    ###1. 项目背景 在Python即时网络爬虫项目启动说明中我们讨论一个数字:程序员浪费在调测内容提取规则上的时间太多了(见上图),从而我们发起了这个项目,把程序员从繁琐的调测规则中解放出来,投入到 ...

  3. python网络爬虫的项目背景_第四章 Python即时网络爬虫项目: 内容提取器的定义

    1. 项目背景 在python即时网络爬虫项目启动说明中我们讨论一个数字:程序员浪费在调测内容提取规则上的时间,从而我们发起了这个项目,把程序员从繁琐的调测规则中解放出来,投入到更高端的数据处理工作中 ...

  4. python etree创建xml_利用 Python ElementTree 生成 xml的实例

    Python 处理 xml 文档的方法有很多,除了经典的 sax 和 dom 之外,还有一个 ElementTree. 首先 import 之: from xml.etree import Eleme ...

  5. 用python可以处理xml文件怎么打开_Python大神都是这样处理xml文件的!

    最近有同学询问如何利用 Python 处理 xml 文件,特此整理一个比较简洁的操作手册,供大家参阅. 首先准备一个xml文件,xml中的内容如下所示.存储为:student.xml 如果要获取这个x ...

  6. pythonxml库_对python 生成拼接xml报文的示例详解

    最近临时工作要生成xml报名,通过MQ接口发送.简单小程序. 自增长拼成xml报文 Test_001.py # encoding=utf-8 import time orderId = '' s1= ...

  7. delphi读取xml中的内容property name传递参数_Python 进阶知识全篇-XML 解析

    什么是 XML? XML 指可扩展标记语言(eXtensible Markup Language),标准通用标记语言的子集,是一种用于标记电子文件使其具有结构性的标记语言. 你可以通过本站学习 XML ...

  8. IP得到天气预报(3)———XML中CDATA的提取

    上一个Session中,我们可以得到其中的部分信息了.也就是说,如果你自己看的话,就会发现雅虎的天气中,这样读取XML我们也只能得到相应的最低温度,最高温度.或者明天的,或者今天的湿度风速.这是东西都 ...

  9. python专题-读取xml文件

    关于python读取xml文章很多,但大多文章都是贴一个xml文件,然后再贴个处理文件的代码.这样并不利于初学者的学习,希望这篇文章可以更通俗易懂的教如何使用python 来读取xml 文件. 什么是 ...

  10. Python 标准库 —— xml

    什么是 xml? xml:eXtensible Markup Language,即可扩展标记语言,它可以用来标记数据/定义数据类型,是一种允许用户对自己的标记语言进行定义的源语言. // abc.xm ...

最新文章

  1. ADB 查看 crash log
  2. Animation Override Controller动画重载器
  3. 公有/私有/保护继承、overload/overwrite/override之间的区别
  4. 计算机视觉库OpenCV之saturate_cast防数据越界函数
  5. 从明面上学习ASP.NET Core
  6. c语言qt生成dll与加载dll,Qt制作界面的DLL以及调用
  7. 退火算法 贪婪算法_算法贪婪策略简介
  8. 求带权中位数的Select算法
  9. 虎牙游戏直播基于php swoole,centos6.8 php7+swoole 实现赛事直播系统
  10. 学习 ASP.NET MVC (第二回)实战篇
  11. 计算机组成原理 第一章 计算机系统概述
  12. 《设计模式系列》---备忘录模式
  13. Atitit 企业战略目标的艺术 目录 1. 企业战略目标 1 2.  特点 ▪ 宏观性 ▪ 长期性 ▪ 全面性 稳定性 1 3. 内容 2 3.1. 彼得·德鲁克在《管理实践》一书中提出了八个
  14. 长文预警-超详细的熊猫烧香病毒分析_00
  15. cad2010多个文件并排显示_CAD软件同时显示两张或多张图纸的方法
  16. 易语言_酷Q机器人插件_01
  17. 僵尸启示录开始 Scheming Through Ep1 Mac游戏介绍
  18. php storm netbean,的Android R.drawable找不到符号...(使用netbean)
  19. java.sql.SQLException: The server time zone value '�й���׼ʱ��' is unrecognized or represents more tha
  20. Python 元组大全

热门文章

  1. 网络 http(基于tcp协议)
  2. win11 office2021 多个word在一个窗口以多标签的方式显示
  3. 【数据分析】数据分析常用术语
  4. linux安装无法删除分区表,删除LINUX分区
  5. seo基础教程,seo基础教程优选
  6. MySQL-电商数据建表
  7. article-并联机械手爪运动学分析
  8. scikit-learn学习基础知识二
  9. 港科喜讯 | 刘浩教授获评30 Under 30-福布斯中国2021
  10. Android 手机返回键 退出应用