搜索热词

这是xml文档

/

166024/

http://www.orpha.net/consor/cgi-bin/OC_Exp.PHP?lng=en&Expert=166024

Multiple epiphyseal dysplasia,Al-Gazali type/

Multiple epiphyseal dysplasia - macrocephaly - distinctive facies

OMIM/

607131/

/

ICD10/

Q77.3/

166032

http://www.orpha.net/consor/cgi-bin/OC_Exp.PHP?lng=en&Expert=166032

Multiple epiphyseal dysplasia,with miniepiphyses

OMIM

609325

ICD10

Q77.3

提取出来的.txt文件的数据

这是en_product1_Result_OMIM.txt文档

17601166024Multiple epiphyseal dysplasia,Al-Gazali type607131/

17603166032 Multiple epiphyseal dysplasia,with miniepiphyses 609325/

258Alexander disease203450/

17602166029 Multiple epiphyseal dysplasia,with severe proximal femoral dysplasia609324/

对应的Java代码:

package com.yanek.demo.xml.test;

import java.io.BufferedWriter;

import java.io.File;

import java.io.FileWriter;

import java.io.IOException;

import java.util.List;

import org.dom4j.Document;

import org.dom4j.DocumentException;

import org.dom4j.Element;

import org.dom4j.io.SAXReader;

import java.util.ArrayList;

public class xmltran1 {

/**

* @param args

* @throws IOException

*/

public static void main(String[] args) throws IOException {

// dom4,xml

SAXReader saxReader = new SAXReader();

try {

Document document = saxReader.read(new File("D:\\root\\data\\en_product1.xml"));

Element root = document.getRootElement();//得到根节点

FileWriter f=new FileWriter(new File("d:\\en_product1_Result_OMIM.txt"),true);

FileWriter f1=new FileWriter(new File("d:\\en_product1_Result_MSEH.txt"),true);

//FileWriter f1=new FileWriter(new File("E:\\新建文件夹\\a.txt"),true);

FileWriter f2=new FileWriter(new File("d:\\en_product1_Result_UMLS.txt"),true);

FileWriter f3=new FileWriter(new File("d:\\en_product1_Result_ICD.txt"),true);

BufferedWriter writer1 = new BufferedWriter(f);

BufferedWriter writer2 = new BufferedWriter(f1);

BufferedWriter writer3 = new BufferedWriter(f2);

BufferedWriter writer4 = new BufferedWriter(f3);

List actions = root.elements("DisorderList");

for(int i = 0; i < actions.size(); i++){

Element action = (Element) actions.get(i);

List list1 = action.elements("Disorder");

for(int j = 0; j < list1.size(); j++){

Element element1 = (Element) list1.get(j);

System.out.println("Disorder id:"+ element1.attributeValue("id"));

writer1.write(element1.attributeValue("id")+"\t");

writer2.write(element1.attributeValue("id")+"\t");

writer3.write(element1.attributeValue("id")+"\t");

writer4.write(element1.attributeValue("id")+"\t");

List list2 = element1.elements("OrphaNumber");

List ls2 = new ArrayList();

Element element6 = (Element) list2.get(0);

ls2.add(element6.getText());

System.out.println("OrphaNumber:"+ element6.getText());

writer1.write(ls2.get(0)+"\t");

writer2.write(ls2.get(0)+"\t");

writer3.write(ls2.get(0)+"\t");

writer4.write(ls2.get(0)+"\t");

List list3 = element1.elements("Name");

List ls3 = new ArrayList();

Element element5 = (Element) list3.get(0);

ls3.add(element5.getText());

System.out.println("Name:"+ element5.getText());

writer1.write(ls3.get(0)+"\t");

writer2.write(ls3.get(0)+"\t");

writer3.write(ls3.get(0)+"\t");

writer4.write(ls3.get(0)+"\t");

List list4 = element1.elements("ExternalReferenceList");

for (int m = 0; m < list4.size(); m++) {

Element element2 = (Element) list4.get(m);

List list5 = element2.elements("ExternalReference");

for(int p = 0; p < list5.size(); p++){

Element element3 = (Element) list5.get(p);

System.out.println("ExternalReference id:"+ element3.attributeValue("id"));

//writer1.write(element3.attributeValue("id")+"\t");

//writer2.write(element3.attributeValue("id")+"\t");

//writer3.write(element3.attributeValue("id")+"\t");

List list6 = element3.elements("Source");

Element element4 = (Element) list6.get(0);

System.out.println("Source:"+ element4.getText());

if(element4.getText().equals("OMIM")){

/*

List ls6 = new ArrayList();

ls6.add(element4.getText());

System.out.println("Source1:"+ element4.getText());

writer1.write(ls6.get(0)+"\t");

*/

List list7 = element3.elements("Reference");

List ls7 = new ArrayList();

Element element7 = (Element) list7.get(0);

ls7.add(element7.getText());

System.out.println("Reference:"+ element7.getText());

writer1.write(ls7.get(0)+"/");

}else if(element4.getText().equals("ICD10")){

/*

List ls6 = new ArrayList();

ls6.add(element4.getText());

System.out.println("Source1:"+ element4.getText());

writer4.write(ls6.get(0)+"\t");

*/

List list7 = element3.elements("Reference");

List ls7 = new ArrayList();

Element element7 = (Element) list7.get(0);

ls7.add(element7.getText());

System.out.println("Reference:"+ element7.getText());

writer4.write(ls7.get(0)+"/");

}else if(element4.getText().equals("MESH")){

/*

List ls6 = new ArrayList();

ls6.add(element4.getText());

System.out.println("Source:"+ element4.getText());

writer2.write(ls6.get(0)+"\t");

*/

List list7 = element3.elements("Reference");

List ls7 = new ArrayList();

Element element7 = (Element) list7.get(0);

ls7.add(element7.getText());

System.out.println("Reference:"+ element7.getText());

writer2.write(ls7.get(0)+"/");

}else if(element4.getText().equals("UMLS")){

/*

List ls6 = new ArrayList();

ls6.add(element4.getText());

System.out.println("Source:"+ element4.getText());

writer3.write(ls6.get(0)+"\t");

*/

List list7 = element3.elements("Reference");

List ls7 = new ArrayList();

Element element7 = (Element) list7.get(0);

ls7.add(element7.getText());

System.out.println("Reference:"+ element7.getText());

writer3.write(ls7.get(0)+"/");

}

}

}

writer1.write("\r\n");

writer2.write("\r\n");

writer3.write("\r\n");

writer4.write("\r\n");

writer1.flush();

writer2.flush();

writer3.flush();

writer4.flush();

}

}

writer1.close();

writer2.close();

writer3.close();

writer4.close();

}catch (DocumentException e) {

// TODO Auto-generated catch block

e.printStackTrace();

}

}

}

总结

如果觉得编程之家网站内容还不错,欢迎将编程之家网站推荐给程序员好友。

本图文内容来源于网友网络收集整理提供,作为学习参考使用,版权属于原作者。

php记录xml到txt,提取xml文档的内容到.txt文件中相关推荐

  1. python docx 合并文档 图片_Python检查Word文件中包含特定关键字的所有页码

    推荐教材:<Python程序设计基础与应用>(ISBN:9787111606178),董付国,机械工业出版社图书详情:配套资源:用书教师可以联系董老师获取教学大纲.课件.源码.教案.考试系 ...

  2. Office Open XML学习(1)-创建excel文档,并向单元格中插入字符串

    做企业级应用,跟office打交道是少不了的.这里的Office不仅仅局限于微软的Office,还有第三方的Open Office之类..Net传统的Office操作方法(比如OleDB,OWC之类) ...

  3. Python3-word文档操作(二):利用python获取word文档的内容

    上一篇,学习了是用python的docx库创建一个word文档,并且编辑了标题和正文.本篇继续python操作word之旅:利用python来获取word文档的内容. python脚本: # -*- ...

  4. C#提取TXT文档指定内容

    早上有分享一篇<VB.NET提取TXT文档指定内容> http://www.cnblogs.com/insus/p/3267347.html 那是原网友的需求用VB.NET写的. 刚才有只 ...

  5. DCMTK:将XML文档的内容转换为DICOM结构的报告文件

    DCMTK:将XML文档的内容转换为DICOM结构的报告文件 将XML文档的内容转换为DICOM结构的报告文件 将XML文档的内容转换为DICOM结构的报告文件 #include "dcmt ...

  6. Win 10 开发中Adaptive磁贴模板的XML文档结构,Win10 应用开发中自适应Toast通知的XML文档结构...

    分享两篇Win 10应用开发的XML文档结构:Win 10 开发中Adaptive磁贴模板的XML文档结构,Win10 应用开发中自适应Toast通知的XML文档结构. Win 10 开发中Adapt ...

  7. Python爬虫高级库之一的lxml库中,ET.parse()是一个非常重要的方法。它可以将任意XML或HTML格式的文档解析成一个ElementTree对象,...

    Python爬虫高级库之一的lxml库中,ET.parse()是一个非常重要的方法.它可以将任意XML或HTML格式的文档解析成一个ElementTree对象,方便我们对结构化的数据进行处理和分析.在 ...

  8. 如何批量提取 PDF 文档内容,将 PDF 格式文档转为 Txt 文本格式

    概要:PDF 文档常常用来阅读.预览或者存档一些资料,PDF 支持的内容也是比较丰富的.可以支持图片.文本等多种类型的元素.那有时候我们就需要将一些纯文本的 PDF 文档中的文字提取出来,转为一个 T ...

  9. Python使用标准库zipfile+re提取docx文档中超链接文本和链接地址

    推荐教材: <Python程序设计实用教程>,ISBN:978-7-5635-6065-3,董付国,北京邮电大学出版社 教材封面: 全国各地新华书店有售 京东购买链接: 配套资源:教学大纲 ...

最新文章

  1. Java从SFTP服务器下载文件一
  2. 前端学习(1538):angular特性简介
  3. 风格指南——Solidity中文文档(10)
  4. 【Cocos2d入门教程五】Cocos2d-x动作篇
  5. 基于ADS54J40的JESD204B ADC 1GHz采样逻辑开发笔记
  6. 游戏引擎:BigWorld(大世界3D游戏引擎)、KBengine、Skynet
  7. 新增收货地址html,客户收货地址列表、添加地址、选择地址
  8. 蒋方舟:到清华不再做名人 狂热崇拜理工男生
  9. 水刺无纺布滤芯详细说明
  10. 青龙面板跑爱企查脚本 兑换爱奇艺月卡 百度网盘会员等
  11. oracle omf管理,论OMF管理文件的重要性
  12. Charles 乱码解决办法
  13. 什么是软件众包?软件众包有什么价值?
  14. 从SOD到OOD(C++风格程序设计)
  15. rebar3 windows下安装
  16. 嵌入式软件开发工程师成长历程
  17. android记事本的设计报告,基于android记事本的设计与开发开题报告.doc
  18. CMAQ排放清单工具:ISAT.M Linux版本的使用
  19. 熊彼特的创新理论:非连续性模型
  20. DeepGCNs-Can GCNs Go as Deep as CNNs? ICCV 2019

热门文章

  1. 从简短笑话中感悟人生
  2. C语言入门——打印爱心
  3. 思维导图给你讲述“出轨33天”的故事
  4. 最流行的经典爱情语句
  5. [转] 高数原来可以这么诗意
  6. 告别MediaPlayer,基于MediaCodec的异步视频解码方案,让你的视频想怎么播就怎么播
  7. 【微信公众号开发(Java版)笔记整理二】消息处理
  8. cad怎么卸载干净_怎么卸载干净office?附卸载工具+教程方法
  9. 提高计算机桌面性能,如何提高电脑运行速度 电脑高性能优化方法
  10. 网络赚钱 签到就可以赚钱的网赚 持续更新