php记录xml到txt,提取xml文档的内容到.txt文件中
搜索热词
这是xml文档
/
166024/
http://www.orpha.net/consor/cgi-bin/OC_Exp.PHP?lng=en&Expert=166024
Multiple epiphyseal dysplasia,Al-Gazali type/
Multiple epiphyseal dysplasia - macrocephaly - distinctive facies
OMIM/
607131/
/
ICD10/
Q77.3/
166032
http://www.orpha.net/consor/cgi-bin/OC_Exp.PHP?lng=en&Expert=166032
Multiple epiphyseal dysplasia,with miniepiphyses
OMIM
609325
ICD10
Q77.3
提取出来的.txt文件的数据
这是en_product1_Result_OMIM.txt文档
17601166024Multiple epiphyseal dysplasia,Al-Gazali type607131/
17603166032 Multiple epiphyseal dysplasia,with miniepiphyses 609325/
258Alexander disease203450/
17602166029 Multiple epiphyseal dysplasia,with severe proximal femoral dysplasia609324/
对应的Java代码:
package com.yanek.demo.xml.test;
import java.io.BufferedWriter;
import java.io.File;
import java.io.FileWriter;
import java.io.IOException;
import java.util.List;
import org.dom4j.Document;
import org.dom4j.DocumentException;
import org.dom4j.Element;
import org.dom4j.io.SAXReader;
import java.util.ArrayList;
public class xmltran1 {
/**
* @param args
* @throws IOException
*/
public static void main(String[] args) throws IOException {
// dom4,xml
SAXReader saxReader = new SAXReader();
try {
Document document = saxReader.read(new File("D:\\root\\data\\en_product1.xml"));
Element root = document.getRootElement();//得到根节点
FileWriter f=new FileWriter(new File("d:\\en_product1_Result_OMIM.txt"),true);
FileWriter f1=new FileWriter(new File("d:\\en_product1_Result_MSEH.txt"),true);
//FileWriter f1=new FileWriter(new File("E:\\新建文件夹\\a.txt"),true);
FileWriter f2=new FileWriter(new File("d:\\en_product1_Result_UMLS.txt"),true);
FileWriter f3=new FileWriter(new File("d:\\en_product1_Result_ICD.txt"),true);
BufferedWriter writer1 = new BufferedWriter(f);
BufferedWriter writer2 = new BufferedWriter(f1);
BufferedWriter writer3 = new BufferedWriter(f2);
BufferedWriter writer4 = new BufferedWriter(f3);
List actions = root.elements("DisorderList");
for(int i = 0; i < actions.size(); i++){
Element action = (Element) actions.get(i);
List list1 = action.elements("Disorder");
for(int j = 0; j < list1.size(); j++){
Element element1 = (Element) list1.get(j);
System.out.println("Disorder id:"+ element1.attributeValue("id"));
writer1.write(element1.attributeValue("id")+"\t");
writer2.write(element1.attributeValue("id")+"\t");
writer3.write(element1.attributeValue("id")+"\t");
writer4.write(element1.attributeValue("id")+"\t");
List list2 = element1.elements("OrphaNumber");
List ls2 = new ArrayList();
Element element6 = (Element) list2.get(0);
ls2.add(element6.getText());
System.out.println("OrphaNumber:"+ element6.getText());
writer1.write(ls2.get(0)+"\t");
writer2.write(ls2.get(0)+"\t");
writer3.write(ls2.get(0)+"\t");
writer4.write(ls2.get(0)+"\t");
List list3 = element1.elements("Name");
List ls3 = new ArrayList();
Element element5 = (Element) list3.get(0);
ls3.add(element5.getText());
System.out.println("Name:"+ element5.getText());
writer1.write(ls3.get(0)+"\t");
writer2.write(ls3.get(0)+"\t");
writer3.write(ls3.get(0)+"\t");
writer4.write(ls3.get(0)+"\t");
List list4 = element1.elements("ExternalReferenceList");
for (int m = 0; m < list4.size(); m++) {
Element element2 = (Element) list4.get(m);
List list5 = element2.elements("ExternalReference");
for(int p = 0; p < list5.size(); p++){
Element element3 = (Element) list5.get(p);
System.out.println("ExternalReference id:"+ element3.attributeValue("id"));
//writer1.write(element3.attributeValue("id")+"\t");
//writer2.write(element3.attributeValue("id")+"\t");
//writer3.write(element3.attributeValue("id")+"\t");
List list6 = element3.elements("Source");
Element element4 = (Element) list6.get(0);
System.out.println("Source:"+ element4.getText());
if(element4.getText().equals("OMIM")){
/*
List ls6 = new ArrayList();
ls6.add(element4.getText());
System.out.println("Source1:"+ element4.getText());
writer1.write(ls6.get(0)+"\t");
*/
List list7 = element3.elements("Reference");
List ls7 = new ArrayList();
Element element7 = (Element) list7.get(0);
ls7.add(element7.getText());
System.out.println("Reference:"+ element7.getText());
writer1.write(ls7.get(0)+"/");
}else if(element4.getText().equals("ICD10")){
/*
List ls6 = new ArrayList();
ls6.add(element4.getText());
System.out.println("Source1:"+ element4.getText());
writer4.write(ls6.get(0)+"\t");
*/
List list7 = element3.elements("Reference");
List ls7 = new ArrayList();
Element element7 = (Element) list7.get(0);
ls7.add(element7.getText());
System.out.println("Reference:"+ element7.getText());
writer4.write(ls7.get(0)+"/");
}else if(element4.getText().equals("MESH")){
/*
List ls6 = new ArrayList();
ls6.add(element4.getText());
System.out.println("Source:"+ element4.getText());
writer2.write(ls6.get(0)+"\t");
*/
List list7 = element3.elements("Reference");
List ls7 = new ArrayList();
Element element7 = (Element) list7.get(0);
ls7.add(element7.getText());
System.out.println("Reference:"+ element7.getText());
writer2.write(ls7.get(0)+"/");
}else if(element4.getText().equals("UMLS")){
/*
List ls6 = new ArrayList();
ls6.add(element4.getText());
System.out.println("Source:"+ element4.getText());
writer3.write(ls6.get(0)+"\t");
*/
List list7 = element3.elements("Reference");
List ls7 = new ArrayList();
Element element7 = (Element) list7.get(0);
ls7.add(element7.getText());
System.out.println("Reference:"+ element7.getText());
writer3.write(ls7.get(0)+"/");
}
}
}
writer1.write("\r\n");
writer2.write("\r\n");
writer3.write("\r\n");
writer4.write("\r\n");
writer1.flush();
writer2.flush();
writer3.flush();
writer4.flush();
}
}
writer1.close();
writer2.close();
writer3.close();
writer4.close();
}catch (DocumentException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
}
}
总结
如果觉得编程之家网站内容还不错,欢迎将编程之家网站推荐给程序员好友。
本图文内容来源于网友网络收集整理提供,作为学习参考使用,版权属于原作者。
php记录xml到txt,提取xml文档的内容到.txt文件中相关推荐
- python docx 合并文档 图片_Python检查Word文件中包含特定关键字的所有页码
推荐教材:<Python程序设计基础与应用>(ISBN:9787111606178),董付国,机械工业出版社图书详情:配套资源:用书教师可以联系董老师获取教学大纲.课件.源码.教案.考试系 ...
- Office Open XML学习(1)-创建excel文档,并向单元格中插入字符串
做企业级应用,跟office打交道是少不了的.这里的Office不仅仅局限于微软的Office,还有第三方的Open Office之类..Net传统的Office操作方法(比如OleDB,OWC之类) ...
- Python3-word文档操作(二):利用python获取word文档的内容
上一篇,学习了是用python的docx库创建一个word文档,并且编辑了标题和正文.本篇继续python操作word之旅:利用python来获取word文档的内容. python脚本: # -*- ...
- C#提取TXT文档指定内容
早上有分享一篇<VB.NET提取TXT文档指定内容> http://www.cnblogs.com/insus/p/3267347.html 那是原网友的需求用VB.NET写的. 刚才有只 ...
- DCMTK:将XML文档的内容转换为DICOM结构的报告文件
DCMTK:将XML文档的内容转换为DICOM结构的报告文件 将XML文档的内容转换为DICOM结构的报告文件 将XML文档的内容转换为DICOM结构的报告文件 #include "dcmt ...
- Win 10 开发中Adaptive磁贴模板的XML文档结构,Win10 应用开发中自适应Toast通知的XML文档结构...
分享两篇Win 10应用开发的XML文档结构:Win 10 开发中Adaptive磁贴模板的XML文档结构,Win10 应用开发中自适应Toast通知的XML文档结构. Win 10 开发中Adapt ...
- Python爬虫高级库之一的lxml库中,ET.parse()是一个非常重要的方法。它可以将任意XML或HTML格式的文档解析成一个ElementTree对象,...
Python爬虫高级库之一的lxml库中,ET.parse()是一个非常重要的方法.它可以将任意XML或HTML格式的文档解析成一个ElementTree对象,方便我们对结构化的数据进行处理和分析.在 ...
- 如何批量提取 PDF 文档内容,将 PDF 格式文档转为 Txt 文本格式
概要:PDF 文档常常用来阅读.预览或者存档一些资料,PDF 支持的内容也是比较丰富的.可以支持图片.文本等多种类型的元素.那有时候我们就需要将一些纯文本的 PDF 文档中的文字提取出来,转为一个 T ...
- Python使用标准库zipfile+re提取docx文档中超链接文本和链接地址
推荐教材: <Python程序设计实用教程>,ISBN:978-7-5635-6065-3,董付国,北京邮电大学出版社 教材封面: 全国各地新华书店有售 京东购买链接: 配套资源:教学大纲 ...
最新文章
- Java从SFTP服务器下载文件一
- 前端学习(1538):angular特性简介
- 风格指南——Solidity中文文档(10)
- 【Cocos2d入门教程五】Cocos2d-x动作篇
- 基于ADS54J40的JESD204B ADC 1GHz采样逻辑开发笔记
- 游戏引擎:BigWorld(大世界3D游戏引擎)、KBengine、Skynet
- 新增收货地址html,客户收货地址列表、添加地址、选择地址
- 蒋方舟:到清华不再做名人 狂热崇拜理工男生
- 水刺无纺布滤芯详细说明
- 青龙面板跑爱企查脚本 兑换爱奇艺月卡 百度网盘会员等
- oracle omf管理,论OMF管理文件的重要性
- Charles 乱码解决办法
- 什么是软件众包?软件众包有什么价值?
- 从SOD到OOD(C++风格程序设计)
- rebar3 windows下安装
- 嵌入式软件开发工程师成长历程
- android记事本的设计报告,基于android记事本的设计与开发开题报告.doc
- CMAQ排放清单工具:ISAT.M Linux版本的使用
- 熊彼特的创新理论:非连续性模型
- DeepGCNs-Can GCNs Go as Deep as CNNs? ICCV 2019