php记录xml到txt,提取xml文档的内容到.txt文件中

搜索热词

这是xml文档

166024/

http://www.orpha.net/consor/cgi-bin/OC_Exp.PHP?lng=en&Expert=166024

Multiple epiphyseal dysplasia,Al-Gazali type/

Multiple epiphyseal dysplasia - macrocephaly - distinctive facies

OMIM/

607131/

ICD10/

Q77.3/

166032

http://www.orpha.net/consor/cgi-bin/OC_Exp.PHP?lng=en&Expert=166032

Multiple epiphyseal dysplasia,with miniepiphyses

OMIM

609325

ICD10

Q77.3

提取出来的.txt文件的数据

这是en_product1_Result_OMIM.txt文档

17601166024Multiple epiphyseal dysplasia,Al-Gazali type607131/

17603166032 Multiple epiphyseal dysplasia,with miniepiphyses 609325/

258Alexander disease203450/

17602166029 Multiple epiphyseal dysplasia,with severe proximal femoral dysplasia609324/

对应的Java代码：

package com.yanek.demo.xml.test;

import java.io.BufferedWriter;

import java.io.File;

import java.io.FileWriter;

import java.io.IOException;

import java.util.List;

import org.dom4j.Document;

import org.dom4j.DocumentException;

import org.dom4j.Element;

import org.dom4j.io.SAXReader;

import java.util.ArrayList;

public class xmltran1 {

/**

* @param args

* @throws IOException

public static void main(String[] args) throws IOException {

// dom4,xml

SAXReader saxReader = new SAXReader();

try {

Document document = saxReader.read(new File("D:\\root\\data\\en_product1.xml"));

Element root = document.getRootElement();//得到根节点

FileWriter f=new FileWriter(new File("d:\\en_product1_Result_OMIM.txt"),true);

FileWriter f1=new FileWriter(new File("d:\\en_product1_Result_MSEH.txt"),true);

//FileWriter f1=new FileWriter(new File("E:\\新建文件夹\\a.txt"),true);

FileWriter f2=new FileWriter(new File("d:\\en_product1_Result_UMLS.txt"),true);

FileWriter f3=new FileWriter(new File("d:\\en_product1_Result_ICD.txt"),true);

BufferedWriter writer1 = new BufferedWriter(f);

BufferedWriter writer2 = new BufferedWriter(f1);

BufferedWriter writer3 = new BufferedWriter(f2);

BufferedWriter writer4 = new BufferedWriter(f3);

List actions = root.elements("DisorderList");

for(int i = 0; i < actions.size(); i++){

Element action = (Element) actions.get(i);

List list1 = action.elements("Disorder");

for(int j = 0; j < list1.size(); j++){

Element element1 = (Element) list1.get(j);

System.out.println("Disorder id:"+ element1.attributeValue("id"));

writer1.write(element1.attributeValue("id")+"\t");

writer2.write(element1.attributeValue("id")+"\t");

writer3.write(element1.attributeValue("id")+"\t");

writer4.write(element1.attributeValue("id")+"\t");

List list2 = element1.elements("OrphaNumber");

List ls2 = new ArrayList();

Element element6 = (Element) list2.get(0);

ls2.add(element6.getText());

System.out.println("OrphaNumber:"+ element6.getText());

writer1.write(ls2.get(0)+"\t");

writer2.write(ls2.get(0)+"\t");

writer3.write(ls2.get(0)+"\t");

writer4.write(ls2.get(0)+"\t");

List list3 = element1.elements("Name");

List ls3 = new ArrayList();

Element element5 = (Element) list3.get(0);

ls3.add(element5.getText());

System.out.println("Name:"+ element5.getText());

writer1.write(ls3.get(0)+"\t");

writer2.write(ls3.get(0)+"\t");

writer3.write(ls3.get(0)+"\t");

writer4.write(ls3.get(0)+"\t");

List list4 = element1.elements("ExternalReferenceList");

for (int m = 0; m < list4.size(); m++) {

Element element2 = (Element) list4.get(m);

List list5 = element2.elements("ExternalReference");

for(int p = 0; p < list5.size(); p++){

Element element3 = (Element) list5.get(p);

System.out.println("ExternalReference id:"+ element3.attributeValue("id"));

//writer1.write(element3.attributeValue("id")+"\t");

//writer2.write(element3.attributeValue("id")+"\t");

//writer3.write(element3.attributeValue("id")+"\t");

List list6 = element3.elements("Source");

Element element4 = (Element) list6.get(0);

System.out.println("Source:"+ element4.getText());

if(element4.getText().equals("OMIM")){

List ls6 = new ArrayList();

ls6.add(element4.getText());

System.out.println("Source1:"+ element4.getText());

writer1.write(ls6.get(0)+"\t");

List list7 = element3.elements("Reference");

List ls7 = new ArrayList();

Element element7 = (Element) list7.get(0);

ls7.add(element7.getText());

System.out.println("Reference:"+ element7.getText());

writer1.write(ls7.get(0)+"/");

}else if(element4.getText().equals("ICD10")){

List ls6 = new ArrayList();

ls6.add(element4.getText());

System.out.println("Source1:"+ element4.getText());

writer4.write(ls6.get(0)+"\t");

List list7 = element3.elements("Reference");

List ls7 = new ArrayList();

Element element7 = (Element) list7.get(0);

ls7.add(element7.getText());

System.out.println("Reference:"+ element7.getText());

writer4.write(ls7.get(0)+"/");

}else if(element4.getText().equals("MESH")){

List ls6 = new ArrayList();

ls6.add(element4.getText());

System.out.println("Source:"+ element4.getText());

writer2.write(ls6.get(0)+"\t");

List list7 = element3.elements("Reference");

List ls7 = new ArrayList();

Element element7 = (Element) list7.get(0);

ls7.add(element7.getText());

System.out.println("Reference:"+ element7.getText());

writer2.write(ls7.get(0)+"/");

}else if(element4.getText().equals("UMLS")){

List ls6 = new ArrayList();

ls6.add(element4.getText());

System.out.println("Source:"+ element4.getText());

writer3.write(ls6.get(0)+"\t");

List list7 = element3.elements("Reference");

List ls7 = new ArrayList();

Element element7 = (Element) list7.get(0);

ls7.add(element7.getText());

System.out.println("Reference:"+ element7.getText());

writer3.write(ls7.get(0)+"/");

}

writer1.write("\r\n");

writer2.write("\r\n");

writer3.write("\r\n");

writer4.write("\r\n");

writer1.flush();

writer2.flush();

writer3.flush();

writer4.flush();

}

writer1.close();

writer2.close();

writer3.close();

writer4.close();

}catch (DocumentException e) {

// TODO Auto-generated catch block

e.printStackTrace();

}

总结

如果觉得编程之家网站内容还不错，欢迎将编程之家网站推荐给程序员好友。

本图文内容来源于网友网络收集整理提供，作为学习参考使用，版权属于原作者。

php记录xml到txt,提取xml文档的内容到.txt文件中相关推荐

python docx 合并文档图片_Python检查Word文件中包含特定关键字的所有页码
推荐教材:<Python程序设计基础与应用>(ISBN:9787111606178),董付国,机械工业出版社图书详情:配套资源:用书教师可以联系董老师获取教学大纲.课件.源码.教案.考试系 ...
Office Open XML学习(1)-创建excel文档，并向单元格中插入字符串
做企业级应用,跟office打交道是少不了的.这里的Office不仅仅局限于微软的Office,还有第三方的Open Office之类..Net传统的Office操作方法(比如OleDB,OWC之类) ...
Python3-word文档操作（二）：利用python获取word文档的内容
上一篇,学习了是用python的docx库创建一个word文档,并且编辑了标题和正文.本篇继续python操作word之旅:利用python来获取word文档的内容. python脚本: # -*- ...
C#提取TXT文档指定内容
早上有分享一篇<VB.NET提取TXT文档指定内容> http://www.cnblogs.com/insus/p/3267347.html 那是原网友的需求用VB.NET写的. 刚才有只 ...
DCMTK：将XML文档的内容转换为DICOM结构的报告文件
DCMTK:将XML文档的内容转换为DICOM结构的报告文件将XML文档的内容转换为DICOM结构的报告文件将XML文档的内容转换为DICOM结构的报告文件 #include "dcmt ...
Win 10 开发中Adaptive磁贴模板的XML文档结构，Win10 应用开发中自适应Toast通知的XML文档结构...
分享两篇Win 10应用开发的XML文档结构:Win 10 开发中Adaptive磁贴模板的XML文档结构,Win10 应用开发中自适应Toast通知的XML文档结构. Win 10 开发中Adapt ...
Python爬虫高级库之一的lxml库中，ET.parse()是一个非常重要的方法。它可以将任意XML或HTML格式的文档解析成一个ElementTree对象，...
Python爬虫高级库之一的lxml库中,ET.parse()是一个非常重要的方法.它可以将任意XML或HTML格式的文档解析成一个ElementTree对象,方便我们对结构化的数据进行处理和分析.在 ...
如何批量提取 PDF 文档内容，将 PDF 格式文档转为 Txt 文本格式
概要:PDF 文档常常用来阅读.预览或者存档一些资料,PDF 支持的内容也是比较丰富的.可以支持图片.文本等多种类型的元素.那有时候我们就需要将一些纯文本的 PDF 文档中的文字提取出来,转为一个 T ...
Python使用标准库zipfile+re提取docx文档中超链接文本和链接地址
推荐教材: <Python程序设计实用教程>,ISBN:978-7-5635-6065-3,董付国,北京邮电大学出版社教材封面: 全国各地新华书店有售京东购买链接: 配套资源:教学大纲 ...

php记录xml到txt,提取xml文档的内容到.txt文件中

php记录xml到txt,提取xml文档的内容到.txt文件中相关推荐

最新文章

热门文章