使用dom4j读取http xml文件,结合XPATH提取数据

使用httpClient、dom4j包

maven依赖

<dependency><groupId>org.apache.httpcomponents</groupId><artifactId>httpclient</artifactId><version>4.0.1</version></dependency><dependency><groupId>dom4j</groupId><artifactId>dom4j</artifactId><version>1.6</version></dependency><dependency><groupId>jaxen</groupId><artifactId>jaxen</artifactId><version>1.1.1</version><exclusions><exclusion><groupId>com.ibm.icu</groupId><artifactId>icu4j</artifactId></exclusion></exclusions></dependency>

示例代码:

import java.io.InputStream;
import java.util.Iterator;
import java.util.List;import org.apache.http.HttpEntity;
import org.apache.http.HttpResponse;
import org.apache.http.client.HttpClient;
import org.apache.http.client.methods.HttpGet;
import org.apache.http.impl.client.DefaultHttpClient;
import org.dom4j.Document;
import org.dom4j.Element;
import org.dom4j.io.SAXReader;public class HttpXML {public static void main(String[] args) throws Exception {test();}public static void test() throws Exception {SAXReader reader = new SAXReader();HttpClient client = new DefaultHttpClient();String url = "http://bbs.btwuji.com/rss.php";HttpGet httpget = new HttpGet(url);HttpResponse response = client.execute(httpget);HttpEntity entity = response.getEntity();if (entity != null) {InputStream is = entity.getContent();Document doc = reader.read(is);Element root = doc.getRootElement();List l=doc.selectNodes("//item/title");Iterator iter=l.iterator();while(iter.hasNext()){Element e=(Element)iter.next();System.out.println(e.getText());}}}
}

参考资料:

XPATH:http://www.w3school.com.cn/xpath/

dom4j:http://www.ibm.com/developerworks/cn/xml/x-dom4j.html/

dom4j读取http xml文件相关推荐

  1. java读取mxl_Dom4j 读取一个XML文件和将String写成XML文件 | 学步园

    dom4j保存文件xml格式和读取XML文件内容,代码如下: package com.qmjs.imut import java.io.File; import java.io.FileWriter; ...

  2. xml文件的书写及读取books.xml文件生成Book类

    books.xml文件的书写: <?xml version="1.0" encoding="UTF-8" ?> <!-- <?xml v ...

  3. 解决dom4j加载xml文件性能慢的问题

    解决dom4j加载xml文件性能慢的问题 参考文章: (1)解决dom4j加载xml文件性能慢的问题 (2)https://www.cnblogs.com/wulm/p/9863104.html 备忘 ...

  4. dom4j解析RDF/XML文件

    dom4j解析RDF/XML文件 xml <?xml version="1.0" encoding="UTF-8" ?> <rdf:RDF x ...

  5. C#如何实现XML文件生成和读取,XML文件的打开方式,解决方案!!!!!!

    以前对XML文件没什么了解,觉得很神奇,其实C#中的XML文件一般就是你们项目下的配置文件,由根节点和子节点组成. 接下来给大家说说XML文件最基础的读取和生成! 以下为C#程序XML文件生成的控制台 ...

  6. dom4j的读写xml文件,读写xml字符串

    百度了一些博客,大同小异,在选取jar包工具的时候大概看了下,大抵是jdom原始,dom4j优秀.于是做了些练习. 参考:http://www.cnblogs.com/mengdd/archive/2 ...

  7. 如何运用JAXB定时读取解析xml文件?

    Background系统 一.背景 在许多开发需求中都解析xml文件的需求,对于规格复杂的xml文件,方法很多主要有JDK原生dom形式,SAX形式,DOM4J ,JAXB 4种方式,但是JAXB(J ...

  8. android读取xml 字符串,Android 读取本地Xml文件,并转换成String

    问题 不是解析本地 xml 文件, 而是要将 xml 文件中的所有内容(包含格式,标签等),直接转换成 String. 与前端H5页面交互时, iOS 在请求远程 xml 文件耗时太长(有时需要4~5 ...

  9. saxreader读取服务器xml文件,使用SAXReader从xml文件读取元素

    我试图使用SAXReader读取下面的xml内容 我必须读取节点名称"SelogerListController"的子元素. 节点名称"SelogerListContro ...

最新文章

  1. 3分钟学会Mysql查询之表连接,左连接,右连接,内连接…
  2. 从 Eclipse 到 IDEA,金字塔到太空堡垒
  3. java error与exception_Java中Error与Exception的区别
  4. 1023 组个最小数 (20 分)(c语言)
  5. 108. Convert Sorted Array to Binary Search Tree
  6. 「递归算法」看这一篇就够了|多图
  7. 赞!清华大学发布首个自动图机器学习工具包AutoGL
  8. 如何求matlab的in(2.0375),东南大学Matlab作业1.doc
  9. 来点实在的 Community Server 2007 剥离出的模式窗口
  10. 全国高级计算机职称考试试题及答案,最新全国计算机职称考试试题及答案.doc...
  11. maven [INFO] No proxies configured [INFO] No proxy was configured, downloading directly
  12. 使用Python分析统计《大秦帝国》人物及七国的出场次数 的顺序(前20)
  13. 将《先生请出山》放到桌面上,聊聊如何将视频做成动态壁纸
  14. 通向架构师的道路(第三天)之apache性能调优 (转)
  15. Java中的数组注意点
  16. Python 爬虫之 Beautifulsoup4,爬网站图片
  17. Elasticsearch 搜索引擎开发实战
  18. “金三银四“,敢不敢“试”?
  19. 批处理文件bat 语法备忘
  20. java smslib 发送短信错误信息

热门文章

  1. 如何在topcoder上进行算法比赛
  2. 50天50个前端小项目(纯html+css+js)第十二天(FAQ 问题与回答框)
  3. C++11 find和find_if的用法
  4. 如何在Eclipse 中将隐藏的包给显示出来
  5. 人民币大写转小写,及人民币格式判断
  6. 互联网大厂的年终奖(华为分红400亿,腾讯每人发股票 )
  7. 平安科技移动开发二队技术周报(第十二期)
  8. wpf TextBox日志文本框
  9. multisim变压器反馈式_Multisim在负反馈放大器性能测试中的应用
  10. linux 下 的tail 命令