xml文件解析的三种方式
SAX解析XML
SAX是一个解析速度快并且占用内存少的xml解析器,非常适合用于Android等移动设备。 SAX解析XML文件采用的是事件驱动,也就是说,它并不需要解析完整个文档,在按内容顺序解析文档的过程中,SAX会判断当前读到的字符是否合法XML语法中的某部分,如果符合就会触发事件。所谓事件,其实就是一些回调(callback)方法,这些方法(事件)定义在ContentHandler接口。下面是一些ContentHandler接口常用的方法:
startDocument()
当遇到文档的开头的时候,调用这个方法,可以在其中做一些预处理的工作。
endDocument()
和上面的方法相对应,当文档结束的时候,调用这个方法,可以在其中做一些善后的工作。
startElement(String namespaceURI, String localName, String qName, Attributes atts)
当读到一个开始标签的时候,会触发这个方法。namespaceURI就是命名空间,localName是不带命名空间前缀的标签名,qName是带命名空间前缀的标签名。通过atts可以得到所有的属性名和相应的值。要注意的是SAX中一个重要的特点就是它的流式处理,当遇到一个标签的时候,它并不会纪录下以前所碰到的标签,也就是说,在startElement()方法中,所有你所知道的信息,就是标签的名字和属性,至于标签的嵌套结构,上层标签的名字,是否有子元属等等其它与结构相关的信息,都是不得而知的,都需要你的程序来完成。这使得SAX在编程处理上没有DOM来得那么方便。
endElement(String uri, String localName, String name)
这个方法和上面的方法相对应,在遇到结束标签的时候,调用这个方法。
characters(char[] ch, int start, int length)
这个方法用来处理在XML文件中读到的内容,第一个参数为文件的字符串内容,后面两个参数是读到的字符串在这个数组中的起始位置和长度,使用new String(ch,start,length)就可以获取内容。
SAX是基于事件驱动的。当然android的事件机制是基于回调函数的,在用SAX解析xml文档时候,在读取到文档开始和结束标签时候就会回调一个事件,在读取到其他节点与内容时候也会回调一个事件。
只要为SAX提供实现ContentHandler接口的类,那么该类就可以得到通知事件(实际上就是SAX调用了该类中的回调方法)。因为ContentHandler是一个接口,在使用的时候可能会有些不方便,因此,SAX还为其制定了一个Helper类:DefaultHandler,它实现了ContentHandler接口,但是其所有的方法体都为空,在实现的时候,你只需要继承这个类,然后重写相应的方法即可。使用SAX解析itcast.xml的代码如下:
public static List<Person> readXML(InputStream inStream) { try { SAXParserFactory spf = SAXParserFactory.newInstance(); SAXParser saxParser = spf.newSAXParser(); //创建解析器 //设置解析器的相关特性,http://xml.org/sax/features/namespaces = true 表示开启命名空间特性 //saxParser.setProperty("http://xml.org/sax/features/namespaces",true); XMLContentHandler handler = new XMLContentHandler(); saxParser.parse(inStream, handler); inStream.close(); return handler.getPersons(); } catch (Exception e) { e.printStackTrace(); } return null; } |
SAX 支持已内置到JDK1.5中,你无需添加任何的jar文件。关于XMLContentHandler的代码实现请看本页下面备注。
实验:
1、 建立xml文件
在src目录下面直接建立xml文件如下
<?xml version="1.0" encoding="utf-8"?> <persons> <person id="100"> <name >Tom</name> <age>20</age> </person> <person id="101"> <name>Mary</name> <age>19</age> </person> </persons> |
2、 创建javabean cn.class3g.domain.person
package cn.class3g.domain; public class Person { private String name; private int age; private int id; public int getId() { return id; } public void setId(int id) { this.id = id; } public String getName() { return name; } public void setName(String name) { this.name = name; } public int getAge() { return age; } public void setAge(int age) { this.age = age; } public String toString() { return "Person [name=" + name + ", age=" + age + ", id=" + id + "]"; } public Person(String name, int age, int id) { super(); this.name = name; this.age = age; this.id = id; } public Person() { } } |
3、 建立业务处理类SAXPersonService 、 PersonHandler
SAXPersonService
package cn.class3g.service; /* * 建立解析Persons.xml的业务类 */ public class SAXPersonService { //创建SAX解析器,并利用PersonHandler对象进行解析,并将结果返回 public List<Person> getPersonList(InputStream inStream) throws Exception{ SAXParserFactory factory = SAXParserFactory.newInstance(); SAXParser parser = factory.newSAXParser(); PersonHandler handler = new PersonHandler(); parser.parse(inStream, handler); List<Person> personList = handler.getPersons(); inStream.close(); return personList; } } |
PersonHandler
package cn.class3g.service; public class PersonHandler extends DefaultHandler { List<Person> persons; Person person; String elementTag=null; public List<Person> getPersons(){ return persons; } public void startDocument() throws SAXException { persons = new ArrayList<Person>(); } public void startElement(String uri, String localName, String qName, Attributes attributes) throws SAXException { if("person".equals(localName)){ person = new Person(); person.setId(new Integer(attributes.getValue(0))); } elementTag = localName; } public void characters(char[] ch, int start, int length) throws SAXException { if(elementTag != null){ String data = new String(ch,start, length).trim(); //为避免出现空指针异常,不要使用elementTag.equals("name") if("name".equals(elementTag)){ person.setName(data); }else if("age".equals(elementTag)){ person.setAge(Integer.valueOf(data)); } } } public void endElement(String uri, String localName, String qName) throws SAXException { /* *注意此时不能用elementTag,因为有可能遇到两个连续的结束标签,连续调用 *endElement,第一个结束标记调用时已经讲elementTag赋值为null,第二次调用会出现 *空指针异常 */ if("person".equals(localName) && person!=null){ persons.add(person); person = null; } elementTag = null; } public void endDocument() throws SAXException { } } |
编写测试类及测试方法
public void testSAX() throws Throwable{ InputStream is = this.getClass().getClassLoader() .getResourceAsStream("persons.xml"); SAXPersonService service = new SAXPersonService(); List<Person> personList = service.getPersonList(is); for(int i=0; i<personList.size(); i++){ Log.i("TAG", personList.get(i).toString()); } } |
DOM解析xml
DOM解析XML文件时,会将XML文件的所有内容以对象树方式存放在内存中,然后允许您使用DOM API遍历XML树、检索所需的数据。使用DOM操作XML的代码看起来比较直观,并且,在某些方面比基于SAX的实现更加简单。但是,因为DOM需要将XML文件的所有内容以对象树方式存放在内存中,所以内存的消耗比较大,特别对于运行Android的移动设备来说,因为设备的资源比较宝贵,所以建议还是采用SAX来解析XML文件,当然,如果XML文件的内容比较小采用DOM是可行的。
创建DOMPersonService类
package cn.class3g.service; … public class DOMPersonService { public static List<Person> getPersonList(InputStream in) throws Exception{ List<Person> personList = new ArrayList<Person>(); DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance(); DocumentBuilder builder = factory.newDocumentBuilder(); Document document = builder.parse(in); //注意是org.w3c.dom.Element; Element root = document.getDocumentElement(); //获取根节点 NodeList nodes = root.getElementsByTagName("person"); for(int i=0; i<nodes.getLength(); i++){ Element personElement = (Element) nodes.item(i); Person person = new Person(); person.setId(Integer.valueOf(personElement.getAttribute("id"))); NodeList childNodes = personElement.getChildNodes(); //遍历person孩子节点,注意这里孩子节点包括那些空格和换行(它们是文本节点) for(int j=0; j<childNodes.getLength(); j++){ Node childNode = childNodes.item(j); //确定是否为元素节点 if(childNode.getNodeType() == Node.ELEMENT_NODE){ if("name".equals(childNode.getNodeName())){ person.setName(childNode.getFirstChild().getNodeValue()); }else if("age".equals(childNode.getNodeName())){ person.setAge(Integer.valueOf(childNode.getFirstChild().getNodeValue())); } } } personList.add(person); } return personList; } } |
测试方法
public void testDOM() throws Throwable{ InputStream is = this.getClass().getClassLoader() .getResourceAsStream("persons.xml"); DOMPersonService service = new DOMPersonService(); List<Person> personList = service.getPersonList(is); Log.i("TAG", personList.toString()); } |
Pull解析xml
除了可以使用 SAX和DOM解析XML文件,大家也可以使用Android内置的Pull解析器解析XML文件。 Pull解析器的运行方式与 SAX 解析器相似。它提供了类似的事件,如:开始元素和结束元素事件,使用parser.next()可以进入下一个元素并触发相应事件。事件将作为数值代码被发送,因此可以使用一个switch对感兴趣的事件进行处理。当元素开始解析时,调用parser.nextText()方法可以获取下一个Text类型元素的值。
Pull解析器的源码及文档下载网址:http://www.xmlpull.org/
实验步骤
添加文件 PullPersonService
package cn.class3g.service; … public class PullPersonService { public List<Person> getPersonList(InputStream in) throws XmlPullParserException, IOException { List<Person> personList = null; XmlPullParser parser = Xml.newPullParser(); parser.setInput(in, "utf-8"); int eventType = parser.getEventType(); Person person = null; while (eventType != XmlPullParser.END_DOCUMENT) { switch (eventType) { case XmlPullParser.START_DOCUMENT: personList = new ArrayList<Person>(); break; case XmlPullParser.START_TAG: // 判断是否为person元素节点 if ("person".equals(parser.getName())) { // 创建person,并读取属性id的值 person = new Person(); person.setId(Integer.valueOf(parser.getAttributeValue(0))); } else if (person != null) { if ("name".equals(parser.getName())) { // 获取name元素值 person.setName(parser.nextText()); } else if ("age".equals(parser.getName())) { person.setAge(Integer.valueOf(parser.nextText())); } } break; case XmlPullParser.END_TAG: //结束标记如果为“person”且person对象不空则添加如list if ("person".equals(parser.getName()) && person != null) { personList.add(person); person = null; } break; } eventType = parser.next(); } return personList; } } |
测试方法
public void testPull() throws Throwable{ InputStream is = this.getClass().getClassLoader() .getResourceAsStream("persons.xml"); PullPersonService service = new PullPersonService(); List<Person> personList = service.getPersonList(is); Log.i("TAG", personList.toString()); } |
xml文件解析的三种方式相关推荐
- android的xml解析方式,Android中对xml文件解析的3种方式总结
前言 xml 是数据传输的一种格式,Android 中的布局文件.设置文件等都采用它来表示.Android 中对 xml 文件的解析也有多种方式,下面介绍常用的 3 种方式: Dom . SAX 和 ...
- xml文件解析的几种方式(一)
常见的几种解析xml文件的方式 XML的解析方式有很多,光开源的就有十多种:如Xerces.JDOM.DOM4J.XOM.JiBX.KXML.XMLBeans.jConfig.XStream.XJR等 ...
- sass文件编译的三种方式【舒】
[舒:]sass文件编译的三种方式 方式一: 1.webstorm打开evtGulp项目或者mcake-activity项目 2.中,开启gulp->default/develop,启动watc ...
- 用python打开文件夹的三种方式
用python打开文件夹的三种方式 一.利用explorer.exe import os# 利用explorer.exe执行 start_directory = r'C:\代码\软件包' os.sys ...
- android xml解析的三种方式
2019独角兽企业重金招聘Python工程师标准>>> 在android开发中,经常用到去解析xml文件,常见的解析xml的方式有一下三种:SAX.Pull.Dom解析方式.最近做了 ...
- XML解析的三种方式(dom,sax,dom4j)
1.Dom解析: 要解析的xml文件内容: <?xml version="1.0" encoding="utf-8" standalone="n ...
- 爬虫之数据解析的三种方式
一,正则表达式解析 re正则就不写了,前面已经写入一篇很详细的正则表达式模块了~ 而且,在爬虫中,下面两种方式用的多一些~ 正则表达式:https://www.cnblogs.com/peng104/ ...
- Python数据解析的三种方式
一,正则表达式解析 在爬虫中,下面两种方式用的多一些~ 大致用法: pattern = re.compile('<dd>.*?board-index.*?>(\d+)</i&g ...
- 爬虫数据解析的三种方式
一.正则表达式解析 常用正则表达式回顾:单字符:. : 除换行以外所有字符[] :[aoe] [a-w] 匹配集合中任意一个字符\d :数字 [0-9]\D : 非数字\w :数字.字母.下划线.中文 ...
最新文章
- 高性能缓存服务器 Nuster
- Linux export 命令用法
- numpy 随机数_数据分析numpy基础看着一篇就够了
- 强推!盘点阿里巴巴 15 款开发者工具 | 程序员硬核评测
- Git合并两个不同的仓库
- 解决python中 .to_csv() 的乱码问题
- 学习笔记大型《构建高性能web站点》
- 在Android关机中插入脚本
- cron表达式每一个小时_嵊泗新闻网丨两千小时的热爱——任春华:用志愿服务守护每一个笑容...
- f5 系统损坏,重新安全系统
- 远景html制造机模板,台式机ALC892制作仿冒appleHDA的教程,前置MIC自动检测。
- 魔兽三界血歌鸿蒙武器怎么合成,魔兽RPG剑域N3剧情攻略 特殊副本武器合成指南[多图]...
- [work] 清华朱军 NIPS 2017对抗样本攻防竞赛总结(附学习资料)
- MVP前奏(二)MVC在Android的小短腿
- html+css实现静态小米商城界面的学习感受与收获
- 拨号ECS和拨号VPS的区别
- 关于windows10系统,玩英雄联盟加载无响应问题的解决办法
- linux去除内容重复行,Linux删除文本中的重复行 - 米扑博客
- 使用JavaScript创建SVG矢量图Code128编码
- [因子背包] CF1647D Madoka and the Best School in Russia