一、废话

  最近几天四川一直下雨,冷!今天到成都的时候,下午3点多的天和晚上天差不多,黑呼呼的... ...难道传说的2012来了?哈哈哈... ...

二、正文  

  在上一篇笔记中提到过说在Android系统中,存储数据的方式除了SQLite外,还有很多其他的方式,比较常用的就是XML方式。在Android中,比较常用的XML解析方式有SAX方式和DOM方式。下面就来看看这两种方式吧。

1、 SAX解析

  SAX——Simple API for XML,在org.xml.sax包中被提供使用。SAX是基于事件驱动的,有事件就一定有事件源,这个事件源就是SAX解析XML时的一个XMLReader对象。当XMLReader对象读取到XML文件的开始和结束标签时或者在取到一个节点内容时,都会触发在Handler(事件处理器)中注册的相应事件。

  在XMLReader中可以通过setContentHandler(ContentHandler handler)方法来调用我们自己的Handler,而这个Handler就是我们解析XML文件的核心。我们可以通过继承SDK中的DefaultHandler类来实现一个我们自己的Handler。针对我们今天的主题,主要需要实现以下几个方法。

  • public void startDocument() throws SAXException{}——读取到文档时触发的事件,通常可以通过这个事件来处理一些IO错误之类的事情。
  • public void startElement(String uri, String localName, String qName,Attributes attributes) throws SAXException{}——读取到XML文档内容中的标签时触发,如<work></work>中的<work>标签。
    • uri  XML文档中NameSpace的URI,如果不清楚XML文档中Namespace的可以去网上看看。
    • localName  无前缀的标签名,如<works><work></work></works>标签,返回的可以是work字符串。
    • qName  有前缀具有完整路径的标签名,如<works><work></work></works>中返回的是/works/work字符串。
    • attributes  标签中的属性名,如<work id=”111”></work>这里面的id就是属性,而”111”就是属性值。
  • public void endElement(String uri, String localName, String qName)throws SAXException{}——读取到XML文档内容中的结束标签时触发。
  • public void endDocument() throws SAXException{}——读取到XML文档结尾时触发该事件。
  • public void characters(char[] ch, int start, int length)throws SAXException{}——读取到XML文档某个标签下的内容时,就会调用这个方法返回该内容。
    • ch  内容的字符值。
    • start   读取的开始位置。
    • length  读取的内容长度。

  a) 现在来理下要解析XML文档的整个思路

  • 新建一个SAXParserFactory对象,通过该对象的newSAXParser()方法来获得一个SAXParser对象。
  • 通过SAXParser对象的getXMLReader()方法来获得一个XMLReader对象。
  • 利用XMLReader对象的setConentHandler()方法来注册一个我们自己的Handler对象。
  • 利用XMLReader对象的parse()方法来开始处理我们的XML文档。
  • 实现自己的Handler类。

  b) 普通方式下的解析

 1 package LiB.XMLDemo; 2  3 import org.xml.sax.Attributes; 4 import org.xml.sax.SAXException; 5 import org.xml.sax.helpers.DefaultHandler; 6  7 public class SAXHandler extends DefaultHandler { 8  9     String tagName;10     //当有值存在时,就调用该方法解析取值(如果是空值,也会调用这个方法)11     @Override12     public void characters(char[] ch, int start, int length)13             throws SAXException {14         String value= new String(ch, start,length);15         if(tagName.equals("name"))16         {17             System.out.println("name="+ value);18         }19          if(tagName.equals("age"))20         {21             System.out.println("age="+value);22         }23     }24   25     @Override26     public void endDocument() throws SAXException {27 28             System.out.println("---end----");29     }30 31     @Override32     public void endElement(String uri, String localName, String qName)33             throws SAXException {34         if(localName.equals("work"))35         {36             System.out.println("-----end----work");37         }38     }39 40     @Override41     public void startDocument() throws SAXException {42 43             System.out.println("---begin----");44     }45 46     @Override47     public void startElement(String uri, String localName, String qName,48             Attributes attributes) throws SAXException {49         tagName = localName;50         if(localName.equals("work"))51         {52             for(int i=0;i< attributes.getLength();i++)53             {54                 System.out.println(attributes.getLocalName(i)+"="+attributes.getValue(i));55             }56         }57     }58 59 }

  上面这个方法中存在一个问题:在读取出来的数据中,没区分开始标签和结束标签,所以出现了空值的状况。这个问题我一直都很奇怪,因为在不久前我处理的时候是不存在这个问题的,可是现在出现了。

  c) 改进后的解析

  解决的方法在网上也挺多的,而且大家都比较相似,就是在startElement和endElement方法中设置相应的标志位,然后在characters方法中通过标志位来决定是否需要读取它的内容。

  修改后的方法有兴趣的朋友可以把源码下载下来看看。

2、 DOM解析

  DOM方式解析XML文件呢,就需要将整个XML文档装入我们的手机内存中,如果文档过大,那么将非常的耗费内存,但是这样的好处是解析速度很快,同时DOM解析方式可以只解析你需要的那个部分,灵活性非常大。

  DOM解析的原理呢,其实就是把动过DOM API访问XML文档的树形结构,并获取相应的数据。在java中通过DOM解析XML文件,一般会涉及到以下几个类。

  • DocumentBuilderFactory——创建DocumentBuilder对象的工厂类。
  • DocumentBuilder——通过这个方法可以创建一个能够获取Document实例的API。
  • Document——加载XML文档的入口,这是解析文档的源所在。
  • Element——元素,在DOM中,所有的节点都可以称作Element。
  • NodeList——节点的集合。

  来看看通过DOM方式解析XML文档的步骤吧:

  • 通过javax.xml.parsers包中的DocumentBuilderFactory类的newInstance()方法新建一个DocumentBuilderFactory对象。
  • 通过DocumentBuilderFactory对象的newDocumentBuilder ()方法创建一个DoucumentBuilder对象。
  • 通过DoucumentBuilder的parse()方法读取外部流来创建一个Document对象。
  • 通过Document对象来获得文档中的所有节点的根节点。
  • 通过根节点来解析所需要的文件内容。
 1 package LiB.XMLDemo; 2  3  4 import javax.xml.parsers.DocumentBuilder; 5 import javax.xml.parsers.DocumentBuilderFactory; 6  7 import org.w3c.dom.Document; 8 import org.w3c.dom.Element; 9 import org.w3c.dom.Node;10 import org.w3c.dom.NodeList;11 import org.xml.sax.InputSource;12 13 public class DomHandler {14     public static void GetStringFromDom(InputSource inputSource) {15         try {16             DocumentBuilderFactory factory = DocumentBuilderFactory17                     .newInstance();18             DocumentBuilder builder = factory.newDocumentBuilder();19             Document document = builder.parse(inputSource);20             //获取根节点21             Element rootElement = document.getDocumentElement();22             //获取第一级子节点23             NodeList nodeList = rootElement.getElementsByTagName("work");24             for(int i=0 ; i<nodeList.getLength();i++)25             {26             //String work = rootElement.getElementsByTagName("name").item(0).getFirstChild().getNodeValue();27 28                 Element workElement = ((Element)nodeList.item(i));29                 //获取节点中的属性值30 //String attr= workElement.getAttribute("XXX");31 //通过节点的标签名字来获取值32                 String name = workElement.getElementsByTagName("name").item(0).getFirstChild().getNodeValue();33                 String age = workElement.getElementsByTagName("age").item(0).getFirstChild().getNodeValue();34                 System.out.println("name="+name);35                 System.out.println("age="+age);36             }37 38         } catch (Exception e) {39         }40     }41 }

  其实是用DOM方式来解析XML文件,有一些.NET和java开发经验的同学看到上面的代码都应该非常亲切,因为这和在.NET和java中相似。

3、 二者区别

  SAX——流式解析,通过事件模型解析XML文件,对内存消耗比较小。但是只能顺序解析,也就是说如果你需要的数据在文件的末尾,那么你将需要把整个XML文件全部解析才能得到你想要的数据。

  Dom解析——符合W3C标准的一种解析方式。解析速度非常快。在几乎所有的语言中,都能使用,可以解析你所需要的数据(不管这个数据在文件中间还是文件末尾)。但是这个需要全部加载进系统内存中才能进行解析。

三、总结

  这这个笔记中介绍了两种解析XML文档的方法。从下篇笔记开始,我将介绍如何与蓝牙、WIFI、网络传输相关的一些知识。

【源码下载】

转载于:https://www.cnblogs.com/cxcco/archive/2012/01/10/2318420.html

Android学习笔记(八)XML文档的解析相关推荐

  1. php txtsql 说明,PHP学习笔记(2)txtSQL文档错误

    PHP学习笔记(2)txtSQL文档错误 次阅读 在使用txtSQL的过程中,发现一处帮助文档错误. 在使用altertable命令改变表名称时,发现如果按照帮助文档所说,使用如下代码无法改变表的名称 ...

  2. java中sax的使用_java使用sax对xml文档的解析

    随着互联网技术的发展,XML技术变得越来越重要,从而出现了很多 与XML的整合应用方面的技术,SAX就是其中之一.在这里,我就简要 谈谈java怎样使用sax对xml文档的解析. 首先,让我们来谈谈S ...

  3. Android 学习 笔记_07. XML文件解析

    1.概念 XML:可扩展标记语言,类似html的那些标记.可扩展指的是:没有规定的.限制的.固定的标记.有SAX和DOM两种解析方式. DOM:将XML文档全部装载到内存里面,然后解析成一个棵树,再进 ...

  4. VBS脚本学习:遍历XML文档

    一.脚本源码 使用VBS脚本遍历XML文件 Option Explicit '定义常量 Const NodeElement = 1 '元素 Const NodeText = 3 '文本 Const N ...

  5. Stata学习笔记|profile.do文档

    今天[其实是昨天,因为昨天一直没成功所以拖到今天才完成的]学习的视频是: Stata设置-如何正确设置连玉君老师的profile.do文件_哔哩哔哩_bilibili  [推荐关注up主:小志小视界] ...

  6. 18离线帮助文档_VIM学习笔记 Zeavim离线文档查看器

    Zeal是开源的跨平台软件,用于离线浏览各种开发文档.Zeal使用Dash提供的文档集(Docsets),涵盖近200种开发语言. Zeavim插件,可以在Vim中调用Zeal来查看离线文档. 安装配 ...

  7. Sharepoint学习笔记—ECM系列--文档集(Document Set)的实现

    文档集是 SharePoint Server 2010 中的一项新功能,它使组织能够管理单个可交付文档或工作产品(可包含多个文档或文件).文档集是特殊类型的文件夹,它合并了唯一的文档集属性以及文件夹和 ...

  8. python学习笔记之word文档提取

    """ # !/usr/bin/env python # -*- coding:utf-8 -*- # @Author : 史沐凡 # @file : pdf____张坤 ...

  9. python学习笔记之pdf文档提取

    """ # !/usr/bin/env python # -*- coding:utf-8 -*- # @Author : 史沐凡 # @file : pdf____张坤 ...

最新文章

  1. oracle 202,Oracle Certification 1Z0-202题库
  2. spring boot单元测试
  3. 特权同学笔记-榨干FPGA片上存储资源
  4. 时间序列-ARIMA模型调参检验实战
  5. java 构造函数 和 构造代码块
  6. xampp mysql3306_xmapp_mysql端口冲突解决---Port 3306 in use by......
  7. mysql事务prepare_mysql之 事务prepare 与 commit 阶段分析
  8. 思科Cisco BGP 专题(一) BGP基本概念
  9. 百度自然语言处理开放接口使用代码
  10. 英特尔最新超级计算机,全球超级计算机500强三分之二使用英特尔的处理器
  11. 分布式时序数据库作为工业物联网数据后台的7大优势
  12. [敏捷开发培训] Scrum 和 Kanban
  13. 偏财入财库大富_偏财入库无人不富是什么意思
  14. Ali-Perseus(擎天):统一深度学习分布式通信框架 [弹性人工智能]
  15. FPGA三大串行通信接口之UART
  16. 计算机广告设计发展前景,2018广告设计与制作专业就业前景和就业方向分析
  17. P-touch Editor 批量打印标签
  18. [旭日x3] 动手实践之bpu_rezie以及简化cpp编译流程
  19. FreeBSD服务器的安装与优化(3)
  20. 如何在Windows 7中获得快速,强大的XP风格的搜索

热门文章

  1. wpf中xps文档合并功能实现
  2. PHP 完整实战23种设计模式
  3. iOS之地理位置及定位系统 -- 入门笔记(用Swift)
  4. 电脑上面玩Android 游戏(.apk文件)
  5. php 逗号 分割字符串
  6. linux 笔记之一mysql源码包安装
  7. 家庭主机拨号上网示意图
  8. Centos7更新 SQLite3至版本3.29.0
  9. patator mysql 字典_利用patator进行子域名爆破
  10. python中的装饰器和抽象类