摘要

Java基础加强重温_13：
XML（可拓展标记语言、作用：小型数据库、框架配置文件、不同平台数据交换）、
XML语法（文档、标签/元素、属性、注释、转义字符、CDTA区）
XML约束（DTD约束：文档类型定义约束、Schema约束：XML模式定义约束）
XML解析（解析包：Dom4j，JAXP）、
Dom4j基本使用【Document对象（getRootElement）、Element对象（element(name)，elements，elements(name)）、Attribute对象（getName，getValue）】
Xpath表达式（XML路径语言、方法：selectNodes，selectSingleNodes、绝对路径表达式、相对路径表达式、全文搜索表达式、属性查找表达式）、
XML解析综合案例（传统getter/setter实现、反射实现）

一、XML介绍

1、什么是XML（可扩展标记语言）

1、英文全称extensible Markup Language，中文全称：可扩展标记语言
2、功能：用于各种组件或框架配置文件
3、标签组成：也是一种标记语言，文件内容由各种标签组成。

理解：
英文全称：extensible Markup Language
中文全称：可扩展标记语言，由一组标签(标记，元素)组成

1、XML与HTML的区别

HTML英文全称Hypertext Markup Language，也就是“超文本链接标记语言”，是用于在Internet上显示Web页面的主要标记语言。

2、XML的作用

XML在企业开发中主要有两种应用场景:
1、数据交换，用于不同的系统之间或不同的数据库之间进行数据交换。
XML本身是一个文本文件,可以在不同的系统之间展示数据。
2、用于各种框架的配置。如:下面是一个Spring框架配置文件:

理解：
XML的作用
1、可以作为一个小型数据库使用
2、用于框架的配置：作为配置文件使用(重点)
3、可以用于不同平台之间的数据交换

3、XML体验案例

需求

编写一个xml文档，用于描述人员信息，person代表一个人员，id是人员的属性代表人员编号。人员信息，包括age年龄、name姓名、sex性别信息。
效果：使用浏览器查看person.xml文件效果如下

实现步骤

1、使用idea在当前项目新建File，命名为person.xml（当前项目不是当前模块）

创建完成

2、编写person.xml 文件内容

<?xml version="1.0" encoding="UTF-8" ?> <!--这是一个人-->
<person id="110"><!--姓名--><name>张三</name><!--性别--><sex/><!--年年龄--><age>20</age>
</person>

3、点击右上角的浏览器图标运行（IDEA自动集成的功能）

二、XML语法

XML语法包括七部分（第七已不使用）

1、文档声明
2、标签元素Element
3、属性Attribute
4、注释Comment
5、转义字符(实体字符)
6、字符数据区(用于显示大量的特殊字符的时候)
7、处理指令(不使用了)

1、文档声明

版本说明：W3C在1988年2月发布1.0版本, 2004年2月又发布1.1版本,因为1.1版本不能向下兼容1.0版本，所以1.1没有人用。在2004年2月W3C又发布了1.0版本的第三版。我们学习的还是1.0版本。

2、标签(元素)

标签命名规则

1、标签名区分大小写,比如<A>和<a>是不同的标签。
2、不能以数字开头,只能以中文,字母或下划线开头。
3、标签名不能包含空格,比如<name of>可以这样但是<name >不推荐。
4、标签名中不要使用冒号":"，因为:是命名空间一个特殊的字符。

注意事项

1、一个XML文档中只能有一个根标签。
2、开始标签和结束标签必须成对出现。
3、一个标签中可以嵌套若干子标签,但是必须合理嵌套,不能交叉嵌套。
例如: <a>welcome to <b>www.itcast.cn</a></b>是错误的。

标签代码示例

<?xml version="1.0" encoding="UTF-8" ?>
<!--只能有一个根元素-->
<persons><!--这是一个人--><person id="110"><!--姓名--><name>张三</name><!--性别-->        <sex/><!--年龄--><age>20</age></person><!--这是一个人--><person id="110"><!--姓名--><name>张三</name><!--性别--><sex/><!--年龄--><age>20</age></person>
</persons>

3、属性

4、注释

5、转义字符

XML中的转义字符与HTML一样。因为很多符号已经被文档结构所使用,所以在元素体或属性值中想使用这些符号就必须使用转义字符(也叫实体字符)

常见的XML转义字符

转义字符应用示例

需求

有一个<sql>标签,中间包含sql语句,查询所有年龄小于20岁的学生。

错误的写法（未使用转义字符代替符号）

出现无效的标签名

<sql>select * from student where age < 20
</sql>

报错

正确写法（使用转义字符代替符号）

<sql>select * from student where age  &lt; 20
</sql>

6、CDATA区（字符数据区）

可以让某些出现在XML文件中的字符不被XML解析器来解析,始终做为纯文本来操作。

为什么要使用字符数据区：
如果需要转义的字符太多,不方便给每个字符进行转义。

CDATA区示例

XML语法案例

<?xml version="1.0" encoding="utf-8"?>
<!--<?xml version="1.0" encoding="utf-8"?>version：xml语言版本encoding：设置当前XML文档使用的编码注意实现：必须出现在XML文档的第1行第1列标签命名规则- 标签名区分大小写，比如<A> 和<a>是不同的标签。- 不能以数字开头，只能以中文，字母或下划线开头。- 标签名不能包含空格，比如<name of> 但是可以这样<name > 不推荐。- 标签名中不要使用”:”,因为:是命名空间一个特殊的字符。注意事项- 一个XML文档中只能有一个根标签。- 开始标签和结束标签必须成对出现。- 一个标签中可以嵌套若干子标签，但是必须合理嵌套，不能交叉嵌套。- 例如：welcome to <b>www.itcast.cn</b>是错误的。
-->
<person gender='男' ><!-- 有主体标签 --><name>jack</name><!-- 无主体标签--><id /><books><book><name>java ee 入门</name></book></books><sql><!--转义字符：以&开头，以;结尾常用的转义字符：<   &lt;     less than>   &gt;     greater than"  &quot;'  &apos;&  &amp;-->select * from student where age &lt; 20;&gt; &quot;&apos;&amp;</sql><!--CDATA区：字符数据区Character Data语法：<![CDATA[]]>作用：能够保证数据原样输出，不会被解析--><sql><![CDATA[select * from student where age < 20 and score > 60;]]></sql></person>

XML存储数据案例

需求

给通讯录程序设计一个xml文件存储联系人的数据。联系人属性：编号、姓名、性别、电话、QQ、邮箱。
1、文件名: contact.xml
2、使用xml语法进行描述联系人信息。
3、能够存储多个联系人

示例代码1

<?xml version="1.0" encoding="UTF-8"?>
<contactList><contact id="S100"><name>潘金莲</name><gender>女</gender><phone>136909877890</phone><qq>387439274</qq><email>panpan@itcast.cn</email></contact><contact id="S200"><name>武大狼</name><gender>男</gender><phone>13609876543</phone><qq>394535</qq><email>wuda@itcast.cn</email></contact><contact id="X999" ><name>西蒙</name><gender>男</gender><phone>2987342394</phone><qq>29342394</qq><email>aaa@aa.com</email></contact>
</contactList>

示例代码2

<?xml version="1.0" encoding="UTF-8" ?>
<!--
给通讯录程序设计一个xml文件存储联系人的数据。
联系人属性： 编号、 姓名、性别、电话、QQ、邮箱。
- 文件名：contact.xml
- 使用xml语法进行描述联系人信息
- 能够存储多个联系人
-->
<contacts><contact id="100"><name>小泽</name><gender>女</gender><phone>10086</phone><qq>10010</qq><email>10010@qq.com</email></contact><contact id="110"><name>小泽2</name><gender>男</gender><phone>100186</phone><qq>100101</qq><email>100101@qq.com</email></contact>
</contacts>

三、XML约束

因为XML是可扩展标记语言,可以写任意标记,所以我们需要对XML进行一些约束,让它只能出现哪些元素。某些元素下面只能出现哪些子元素,甚至可以指定某些元素的数据类型。从而保证XML文件数据正确性和有效性。

XML约束的作用

用来描述XML文档的结构。
让XML文件的书写更加规范。

XML约束的分类

XML约束有两种：DTD约束、schema约束

1、DTD约束（文档类型定义约束）

DTD约束，英文全称：Document Type Definition。中文名称：文档类型定义
作用：用来约束XML文件的，它本身是一个文本文件

DTD学习要求

在企业实际开发中，我们很少自己编写DTD约束文档，通常情况下通过框架提供的DTD约束文档编写XML文档。

DTD约束使用示例

步骤1：新建bookshelf.dtd文件

选择项目鼠标右键"NEW->File"，文件名为"bookshelf.dtd"

步骤2：编写bookshelf.dtd文件

bookshelf.dtd文件内容如下

<!ELEMENT bookshelf (book+)>
<!ELEMENT book (title,author,price)>
<!ELEMENT title (#PCDATA)>
<!ELEMENT author (#PCDATA)>
<!ELEMENT price (#PCDATA)>
<!ATTLIST author性别 CDATA  #REQUIRED年龄 CDATA  #IMPLIED职务 CDATA  #FIXED "程序员"爱好 CDATA  "旅游" >

DTD文件解释
1、根元素是bookshelf,包含1个或多个book子元素,
2、 book这个子元素包含三个子元素(title,author,price)
3、 title, author, price子元素内容都是文本内容。
4、author元素中包括性别、年龄、职务、爱好等属性

步骤3：根据bookshelf.dtd编写XML文档

根据以上DTD文件约束编写一个符合约束的XML文档

<?xml version="1.0" encoding="utf-8"?>
<!DOCTYPE bookshelf SYSTEM "bookshelf.dtd"> <bookshelf><book><title>JavaEE 开发教程</title><author 性别="男">Jack</author><price>99.8</price></book>
</bookshelf>

XML导入DTD文件格式

步骤4: idea检查xml约束合法性

在idea中，编写bookshelf.xml不符合制定的bookshelf.dtd约束会爆红

2、Schema约束（xml模式定义约束）

Schema约束即XSD（XML Schema Definition），翻译过来就是XML模式定义。
Schema约束是新的XML文档约束，功能更强大，数据类型更完善。要比DTD约束强大很多，是DTD约束的替代者。Schema本身也是XML文档，但Schema文档的扩展名为xsd，而不是xml。

DTD约束不能约束XML中数据的类型，功能上比较简单。Schema约束功能更加强大，可以约束数据的类型,使用相对复杂。Schema约束慢慢的会代替DTD约束。

Schema约束的根元素、文档概念、命名空间

根元素

Schema约束文件本身也是XML文件，所以也有根元素，根元素的名字叫：schema

文档概念

Schema约束的文档
模式文档：制定约束的XML文档(类似于：类)。即Schema约束文件
实例文档：被约束的XML文档(类似于：对象)。即使用Schema约束的xml文件
一个实例文档是可以有多个模式文档进行约束的

命名空间（解决多模式文档约束的标签命名冲突问题）

Schema约束的命名空间与Java中的包是同一用途。如果每个元素和属性都有自己的名称空间，那么就不会出现名字冲突问题，就像是每个类都有自己所在的包一样，那么类名就不会出现冲突。

命名空间作用
用来声明实例文档中使用的标签被哪个schema文件(模式文档)约束。
用来避免元素(标签)和属性命名冲突。

命名空间的定义

定义位置：在模式文档的根元素的开始标签之中，也就是在schema标签中。
定义格式：

targetNamespace="命名空间名"

须知：命名空间名一般是：”URI地址”字符串，比如：” http://www.itheima.com/a”。URI地址不会被解析器用于查找信息，其唯一的作用就是赋予命名空间一个唯一的名称。如下所示：

<?xml version="1.0" encoding="UTF-8"?>
<schema xmlns="http://www.w3.org/2001/XMLSchema" targetNamespace="http://www.ithema.com/a"  elementFormDefault="qualified">
</schema>

targetNamespace=“http://www.ithema.com/a” 就是定义命名空间，名称为：http://www.ithema.com/a，相当于java的包名。

命名空间的使用（引入）

在xml文件中引入，引入命名空间就相当于Java中的导包操作

引入的位置：在实例文档根元素的开始标签之中。
引入的格式

xmlns:前缀=“URI地址”或 xmlns="URI地址"

引入示例和解析说明如下

<?xml version="1.0" encoding="UTF-8"?>
<note xmlns="http://www.itheima.com/a"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation="http://www.itheima.com/a note.xsd ">
</note>

xmlns = “http://www.itheima.com/a”
引入自定义的命名空间，使用默认的命名空间。
xmlns:xsi=“http://www.w3.org/2001/XMLSchema-instance”
引入官方定义的命名空间，使用了前缀xsi，则表示在该实例文档中使用来自该命名空间中定义的元素时需要带上前缀xsi访问。

注意事项
1、没有指定前缀称为默认的命名空间。在访问默认命名空间中定义的元素时不需要带前缀访问。访问非默认命名空间的元素时必须带前缀访问。
2、一个XML文档中只能有一个默认的命名空间。

Schema学习要求

虽然schema功能比dtd强大，但是编写要比DTD复杂，同样以后我们在企业开发中也很少会自己编写schema文件。我们只需要借助开发工具，在现有的xsd约束下，写出正确的xml文件即可。

Schema约束使用示例

步骤1：新建schema约束文件books.xsd（本质也是一个xml文件）

新建schema约束文件books.xsd，对售价约束数据类型，代码如下。

<?xml version="1.0" encoding="UTF-8"?><xs:schema xmlns:xs="http://www.w3.org/2001/XMLSchema"targetNamespace="http://www.itheima.com/book" elementFormDefault="qualified"><!-- 根元素是bookselft，包含子元素，所以是复杂类型 --><xs:element name="bookshelf"><xs:complexType><!-- book出现1~n次 --><xs:sequence minOccurs="1" maxOccurs="unbounded"><!-- book因为包含子元素和属性，所以也是复杂元素 --><xs:element name="book"><!-- 元素要依次出现 --><xs:complexType><xs:sequence><!-- 其它元素都是简单元素 --><xs:element name="title" type="xs:string"/><xs:element name="author" type="xs:string"/><xs:element name="price" type="xs:positiveInteger"/></xs:sequence><!-- 属性要写在最后，这里表示属性必须 --><xs:attribute name="isbn" use="required"/></xs:complexType></xs:element></xs:sequence></xs:complexType></xs:element>
</xs:schema>

此xsd文件的解释:
1、根元素是bookshelf
2、bookshelf中的子元素book可以出现多次
3、book中依次出现三个子元素：title，author，price
4、book中有一个属性: isbn

步骤2：新建books.xml，使用schema约束文件

xml引入schema约束语法：

<根元素 xmlns="命名空间" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"xsi:schemaLocation="命名空间 xsd 约束⽂文件名"> </根元素>

books.xml内容：

<?xml version="1.0" encoding="utf-8"?>
<bookshelf xmlns="http://www.itheima.com/book"xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"xsi:schemaLocation="http://www.itheima.com/book books.xsd"><book isbn="SB100"><title>Java基础教程</title><author>rose</author><price>66</price></book>
</bookshelf>

步骤3：idea检查xml约束合法性

四、XML解析

当将数据存储在XML后，我们就希望通过程序获取XML的内容。如果我们使用Java基础所学的IO知识是可以完成的，不过要非常繁琐的操作才可以完成，所以会使用专门的工具来解析XML。

1、XML解析方式

XML解析方式有两种：DOM解析、SAX解析

DOM解析
概述：一次性将整个xml文档加载到内存中，并在内存中生成一颗DOM树。
优点：可以对树上的元素(节点)进行增删改查操作
缺点：如果xml文档较大，则会占据很多内存

SAX解析
概述：从上往下解析，解析一行释放一行
优点：占据内存少
缺点：只能以只读方式解析，不能执行增删改操作

2、常用的解析开发包

JAXP：Oracle公司提供支持DOM和SAX开发包
Dom4j：比较简单的的解析开发包,将整个XML加载到内存中做为一棵DOM树。

3、DOM解析原理及结构模型（Dom4j）

原理：XML DOM和HTML DOM一样, XML DOM将整个XML文档加载到内存,生成一个DOM树,并获得一个Document对象,通过Document对象就可以对DOM进行操作。

xml文件

DOM树结构模型

4、DOM树的组成元素

Dom树的组成元素

Node  节点  Dom树上的每一个对象都是Node对象Document 文档对象 每一个XML文件加载到内存中都会对应一个DocumentElement  元素(标签或标记)对象，树上每一个标签都是Element对象Attribute  属性对象，标签中每一个属性都是Attribute对象Text  文本对象   每个标签体内容都是Text对象

XML中Element,Node,Attr的区别和联系
https://blog.csdn.net/u011559849/article/details/22983317

五、Dom4j基本使用

采用DOM方式来解析XML文件

Dom4j使用步骤
1、去官网下载zip包。http://www.dom4j.org
2、解压dom4j-1.6.1.zip
3、在项目中创建一个文件夹: lib
4、将dom4j-1.6.1.jar文件复制到lib文件夹
5、在Jar文件上点右键,选择Add as Library->点击OK
6、在类中导包使用

数据准备：创建XML文件contact.xml

在项目中或模块下创建一个XML文件，命名为：contact.xml，内容如下：

<?xml version="1.0" encoding="UTF-8"?>
<contactList><contact id="S100" vip="true"><name>潘金莲</name><gender>女</gender><phone>136909877890</phone><qq>387439274</qq><email>panpan@itcast.cn</email></contact><contact id="S200"><name>武大狼</name><gender>男</gender><phone>13609876543</phone><qq>394535</qq><email>wuda@itcast.cn</email></contact><contact id="X999" ><name>西蒙</name><gender>男</gender><phone>2987342394</phone><qq>29342394</qq><email>aaa@aa.com</email></contact>
</contactList>

1、获得Document对象

一个XML文件加载到内存中时就会创建一个Document对象，该Document对象包含了了XML中的所有
节点内容，通过该对象就可以获得对应XML文件的所有内容。

Document对象常用方法

代码示例1（获得Document对象）

读取XML文档并获取Document对象

/**
* 使用 dom4j 解析工具读取 xml 文件
*/
public class Demo1 {public static void main(String[] args) { try {// 1. 创 建 SAXReader（ 解 析 器 对 象 ） SAXReader reader = new SAXReader();// 2.调用 read 方法，读取 xml 文件Document doc = reader.read("contact.xml"); System.out.println(doc);} catch (DocumentException e) { e.printStackTrace();}}
}

代码示例2（获得xml根元素对象）

需求：获得xml根元素对象并输出到控制台

实现步骤
1. 创建XML解析器对象
2. 调用解析器对象的方法读取XML文档并获取Document对象

public static void main(String[] args) throws DocumentException {// 1.得到文档对象SAXReader reader = new SAXReader();Document document = reader.read("contact.xml");// 2.得到根元素Element root = document.getRootElement();// 3.打印输出System.out.println(root)
}

小结

如何获得Document对象
1、创建XML解析器对象
SAXReader reader = new SAXReader();

2、调用解析器对象的read方法：传递文件对象(关联要解析的xml文档)
Document document = reader.read(new File(“xml文档路径”));

Document对象常用方法
Element rootElement = getRootElement();

2、获得Element对象

DOM树上的每一个标签都是一个Element对象。每一个Elment对象都是Node的子类。

Element常用方法（element(name)、elements、elements(name)）

空格、换行、制表符：也是属于文本的一部分，在解析xml文件的时候要注意处理。

代码示例

需求1:获得所有的contact子元素对象。
需求2:获得contact元素下所有的子元素对象
需求3:输出所有contact元素下子元素的文本内容

package com.itheima._02dom4j;import org.dom4j.Document;
import org.dom4j.Element;
import org.dom4j.io.SAXReader;import java.io.File;
import java.util.List;/**目标：获取Element对象并通过Element对象获取元素名称和元素的文本内容需求：- 需求1：获得所有的contact⼦元素对象- 需求2：获得contact元素下所有的子元素对象- 需求3：输出所有contact元素下子元素的⽂本内容*/
public class Demo02 {public static void main(String[] args) throws Exception{// 1. 创建XML解析器对象SAXReader reader = new SAXReader();// 2. 调用解析器对象的方法读取XML文档并获取Document对象Document document = reader.read(new File("day13_课堂代码/contacts.xml"));// 3. 获得根元素对象Element rootElement = document.getRootElement();// 获得根元素下第一个contact子元素对象System.out.println(rootElement.element("contact"));// - 需求1：获得所有的contact⼦元素对象List<Element> contactElements = rootElement.elements("contact");for (Element contactElement : contactElements) {System.out.println("=============>" + contactElement.elementTextTrim("name"));// - 需求2：获得contact元素下所有的子元素对象（name、gender、phone...）List<Element> childElements = contactElement.elements();for (Element childElement : childElements) {// System.out.println(childElement);// - 需求3：输出所有contact元素下子元素的⽂本内容// String类trim()方法：去除字符串左右两边的空格// "  abc  ".trim() ==> "abc"//  Integer.parseInt(" 100 ".trim());// System.out.println("abc".trim());// 获得标签名称String name = childElement.getName();// 获得标签体内容String text = childElement.getTextTrim();System.out.println(name+"="+text);}}}
}

3、获得Attribute对象

DOM树上每一个元素的属性都是一个Attribute对象，每一个Attribute对象都是Node的子类。
获得Attribute对象前提：先获得元素Element对象，调用Element对象与属性相关的方法。

Attribute常用方法（Attribute对象方法）

Element中与属性相关方法（Element对象方法，与Attribute对象相关的方法）

代码示例

获取Attribute对象并通过Attribute对象获取属性名和属性值

需求1：使用2种方式，得到contact上id属性值
通过属性名获得attribute对象，再用attribute对象获得属性值
通过属性名直接获得属性值

需求2：在contact元素上添加一个vip的属性值为true/false
得到contact上所有的属性名和属性值

public class AttributeDemo01 {public static void main(String[] args)throws Exception{// 1. 创 建 SAXReader（ 解 析 器 对 象 ）SAXReader reader = new SAXReader();// 2.调用 read 方法，读取 xml 文件Document doc = reader.read("day26_dom4j/contact.xml");// 3.得到根元素Element root = doc.getRootElement();// 需求1：获得所有的contact子元素对象List<Element> contacts = root.elements("contact");for (Element contact : contacts) {// ⽅方式1：得到contact上id属性值Attribute idAttr = contact.attribute("id");System.out.println(idAttr.getName()+"="+idAttr.getValue());// ⽅方式2：得到contact上id属性值String id = contact.attributeValue("id");System.out.println(id);}System.out.println("-------得到contact上所有的属性名和属性值 --------");for (Element contact : contacts) {// 获得contact元素上的所有属性List<Attribute> attributes = contact.attributes();// 遍历输出属性名和属性值for (Attribute attr : attributes) {System.out.println(attr.getName()+"="+attr.getValue());}System.out.println("-----------------");}}
}

六、XML路径语言（Xpath表达式）

XPath即为XML路径语言：XML Path Language

作用：XPath使用路径表达式来选取HTML或XML文档中的元素节点或属性节点。

dom4j与Xpath相关的方法（selectSingleNodes、selectNodes）

Xpath表达式语法分类

1、绝对路径表达式
2、相对路径表达式
3、全文搜索表达式
4、属性查找表达式

1、绝对路径表达式

从文档对象、根元素、…一级一级往下找
理解：文档对象相当与盘符

代码示例

需求：采用绝对路径获取方式，从根节点开始逐层查找/contactList/contact/name/节点列表并打印信息
实现步骤
1、创建XML解析器对象
2、读取XML文档并获得Document对象
3、定义xpath表达式: /contactList/contact/name/
4、调用Document对象的selectNodes方法执行xpath获得节点集合
5、遍历输出每个节点

public class XPathDemo01 {// 绝对路径表达式@Testpublic void test01()throws Exception{// 创建xml解析器对象SAXReader saxReader = new SAXReader();// 获得文档对象Document document = saxReader.read("contact.xml");// Xpath表达式：绝对路径表达式String xpath = "/contactList/contact/name";// 使用Xpath查找节点List<Node> list = document.selectNodes(xpath);// 遍历输出for (Node node : list) {System.out.println(node);}}
}

2、相对路径表达式

代码示例

需求：先采用绝对路径获取contactList节点，再采用相对路径获取下一级contact节点的name子节点并打印信息。

实现步骤：
1、创建XML解析器对象
2、读取XML文档并获得Document对象
3、定义Xpath表达式: /contactList
4、调用Document对象的selectsingleNode方法，执行Xpath获得根节点对象
5、通过根节点对象调用selectNodes方法，执行相对路径表达式: ./contact/name
6、打印输出所有的节点

public class XPathDemo02 {// 相对路径表达式@Testpublic void test02()throws Exception{// 创建xml解析器对象SAXReader saxReader = new SAXReader();// 获得文档对象Document document = saxReader.read("contact.xml");// 绝对路径表达式String xpath = "/contactList";// 使用Xpath查找节点Element rootElement = (Element) document.selectSingleNode(xpath);System.out.println(rootElement);// 相对路径表达式：查询rootElement节点下所有name子节点List<Node> contactNodes = rootElement.selectNodes("./contact/name");for (Node node : contactNodes) {System.out.println(node);}

3、全文搜索表达式

全文搜索表达式示例

代码示例1

需求：直接全文搜索所有的contact节点并打印代码

public class XPathDemo03 {// 全文搜索表达式@Testpublic void test03() throws Exception{// 创建xml解析器对象SAXReader saxReader = new SAXReader();// 获得文档对象Document document = saxReader.read("contact.xml");// Xpath表达式: // 表示全文搜索，不管在哪一级String xpath = "//contact";// 使用Xpath查找节点List<Node> nodes = document.selectNodes(xpath);for (Node node : nodes) {System.out.println(node);}}
}

代码示例2

package com.itheima._03xpath;import org.dom4j.Document;
import org.dom4j.Element;
import org.dom4j.io.SAXReader;import java.util.List;/**目标：使用xpath全文搜索路径查询元素需求：直接全文搜索所有的 contact节点并打印*/
public class Demo03 {public static void main(String[] args) throws Exception {// 创建XML解析器对象并获得Document对象Document document = new SAXReader().read("day13_课堂代码/contacts.xml");// 定义全文搜索表达式路径// String xpath = "//contact";// String xpath = "//contact/name";String xpath = "//contact//name";// 根据全文搜索表达式路径查询元素List<Element> contactElements = document.selectNodes(xpath);for (Element contactElement : contactElements) {System.out.println(contactElement);}}
}

4、属性查找表达式

代码示例

需求:
1、查找所有id属性节点
2、查找包括id属性的contact元素
3、查找包括id属性且属性名为S100的contact元素
4、查找不包含vip属性的contact节点代码

package com.itheima._03xpath;import org.dom4j.Attribute;
import org.dom4j.Document;
import org.dom4j.Element;
import org.dom4j.Node;
import org.dom4j.io.SAXReader;import java.util.List;/**目标：使用Xpath表达式查找属性需求：1. 查找所有id属性节点2. 查找包括id属性的contact元素3. 查找包括id属性且属性名为S100的contact元素4. 查找不包含vip属性的contact节点*/
public class Demo04 {public static void main(String[] args) throws Exception {// 创建XML解析器对象并获得Document对象Document document = new SAXReader().read("day13_课堂代码/contacts.xml");// 定义路径表达式//  1. 查找所有id属性节点String xpath01 = "//@id";// 根据路径表达式查询List<Attribute> idAttrs = document.selectNodes(xpath01);for (Attribute idAttr : idAttrs) {System.out.println(idAttr.getName()+"="+idAttr.getValue());}System.out.println("----------------------------------");// 2. 查找包括id属性的contact元素String xpath02 = "//contact[@id]";List<Element> contactElements = document.selectNodes(xpath02);for (Element contactElement : contactElements) {System.out.println(contactElement);}//  3. 查找包括id属性且属性名为S100的contact元素System.out.println("-----------------------------------");String xpath03 = "//contact[@id='S100']";Node node = document.selectSingleNode(xpath03);System.out.println(node);System.out.println("-----------------------------------");// 4. 查找不包含vip属性的contact节点String xpath04 = "//contact[not(@vip)]";List list = document.selectNodes(xpath04);System.out.println(list);}
}

七、XML解析综合案例

需求

利用 Dom4j 的知识，将 contact.xml 文件中的联系人数据封装成集合，其中每个元素是实体类 Contact。打印输出 List 中的每个元素。

数据准备

在项目下创建contact.xml文件

<?xml version="1.0" encoding="UTF-8"?>
<contactList><contact id="100" vip="true"><name>潘金莲</name><gender>女</gender><phone>136909877890</phone><qq>387439274</qq><email>panpan@itcast.cn</email></contact><contact id="200" vip="false"><name>武大狼</name><gender>男</gender><phone>13609876543</phone><qq>394535</qq><email>wuda@itcast.cn</email></contact ><contact id="999"><name>西蒙</name><gender>男</gender><phone>2987342394</phone><qq>29342394</qq><email>aaa@aa.com</email></contact>
</contactList>

Contact类

package com.itheima._04xml解析综合案例;public class Contact {private int id;private String name;private String gender;private String email;private String qq;private String phone;private boolean vip;public int getId() {return id;}public void setId(int id) {this.id = id;}public String getName() {return name;}public void setName(String name) {this.name = name;}public String getGender() {return gender;}public void setGender(String gender) {this.gender = gender;}public String getEmail() {return email;}public void setEmail(String email) {this.email = email;}public String getQq() {return qq;}public void setQq(String qq) {this.qq = qq;}public String getPhone() {return phone;}public void setPhone(String phone) {this.phone = phone;}public boolean isVip() {return vip;}public void setVip(boolean vip) {this.vip = vip;}@Overridepublic String toString() {return "Contact{" +"id=" + id +", name='" + name + '\'' +", gender='" + gender + '\'' +", email='" + email + '\'' +", qq='" + qq + '\'' +", phone='" + phone + '\'' +", vip=" + vip +'}';}
}

代码实现

package com.itheima._04xml解析综合案例;import org.dom4j.Document;
import org.dom4j.Element;
import org.dom4j.io.SAXReader;import java.lang.reflect.Field;
import java.util.ArrayList;
import java.util.List;/**需求：利用 Dom4j 的知识，将 contact.xml 文件中的联系人数据封装成集合，其中每个元素是实体类 Contact。打印输出 List 中的每个元素。实现步骤1. 读取XML文档获得Document对象2. 定义xpath表达式：查询所有contact元素3. 创建集合对象：用来存储Contact对象4. 遍历contact元素：每遍历一个Contact元素就创建一个Contact对象5. 给Contact对象的成员变量赋值6. 将Contact对象添加到集合中7. 遍历输出Contact对象*/
public class Demo01 {public static void main(String[] args) throws Exception{// 1. 读取XML文档获得Document对象Document document = new SAXReader().read("day13_课堂代码/contacts.xml");// 2. 定义xpath表达式：查询所有contact元素String xpath = "//contact";// 3. 创建集合对象：用来存储Contact对象ArrayList<Contact> contacts = new ArrayList<>();// 4. 遍历contact元素List<Element> contactElements = document.selectNodes(xpath);for (Element contactElement : contactElements) {// contactElement代表contact元素//  4.1 创建一个Contact对象Contact contact = new Contact();contact.setId(Integer.parseInt(contactElement.attributeValue("id")));contact.setVip(Boolean.parseBoolean(contactElement.attributeValue("vip")));//方式1，传统getter/setter实现//  4.2 给Contact对象的成员变量赋值/* contact.setName(contactElement.elementTextTrim("name"));contact.setGender(contactElement.elementTextTrim("gender"));contact.setPhone(contactElement.elementTextTrim("phone"));contact.setQq(contactElement.elementTextTrim("qq"));contact.setEmail(contactElement.elementTextTrim("email"));*///方式2，反射实现// 获得Class对象Class c = contact.getClass();// 获得当前contact元素下的所有子元素对象List<Element> childElements = contactElement.elements();// 遍历子元素集合for (Element childElement : childElements) {// 获得元素名称String name = childElement.getName(); // "name"  "gender" ...// 获得元素内容String text = childElement.getTextTrim(); // "潘金莲" "女"// 根据成员变量名获得Field对象Field field = c.getDeclaredField(name);// 暴力反射field.setAccessible(true);// 给对象contact的成员变量赋值为textfield.set(contact, text);}//  4.3.将Contact对象添加到集合中contacts.add(contact);}// 7. 遍历输出Contact对象for (Contact contact : contacts) {System.out.println(contact);}}
}

Java基础加强重温_13：XML（可拓展标记语言）、XML语法、XML约束、XML解析（Dom4j，JAXP）、Dom4j基本使用、Xpath表达式（XML路径语言）、XML解析综合案例相关推荐

Java基础加强重温_08：线程不安全、线程同步、线程状态、线程状态切换、线程池（Executors类、newFixedThreadPool）、死锁、Lambda表达式、Stream
摘要 Java基础加强重温_08: 线程安全(线程安全概念.线程不安全案例). 线程同步(同步代码块.同步方法.Lock锁,锁对象). 线程状态(new新建.Runnable可运行.Blocked锁阻 ...
Java基础加强重温_05：Iterator迭代器、增强for循环、集合综合案例-斗地主、数据结构（栈、队列、数组、链表、红黑树）、List接口、Set接口
摘要: Java基础加强重温_05: Iterator迭代器(指针跟踪元素). 增强for循环(格式.底层). 集合综合案例-斗地主(代码规范抽取代码,集合元素打乱). 数据结构[栈(先进后出,子弹夹 ...
【java基础06：数据类型】及拓展、转义字符、计算机二进制的表现形式
目录 JAVA是强类型语言,所有的变量必须先定义才能使用. 计算机只认识二进制,那么计算机是怎么表示现实世界当中的文字的呢? 计算机二进制的三种表现方式:源码.反码.补码 char类型整数型整数型 ...
Java基础以及变量和运算符、包机制、javadoc生成
Java基础以及变量和运算符.包机制.javadoc生成注释.标识符.关键字注释标识符关键字标识符注意点数据类型强类型语言弱类型语言 Java的数据类型基本类型(primitive ...
使用 Visual C# .NET 通过 XPath 表达式查询 XML
本文演示如何使用 XPathNavigator 类通过 XML 路径语言 (XPath) 表达式查询 XPathDocument 对象.XPath 用于以编程方式计算表达式并选择文档中的特定节点. 回 ...
java基础之XML
目录 java基础之XML 1. XML解析概述 2. DOM4J介绍 2.1 常用包 2.2 内置元素 2.2 Element类 2.3 Attribute类 2.4 常用操作 3. 代码演示 3. ...
Java基础重温_02：运算符、三元运算符案例（2只老虎、3个和尚）、键盘录入（Scanner类）、控制流程语句、控制流程语句案例（奇偶数、考试奖励）
摘要 Java基础重温_02: 运算符(算术运算.+操作.赋值运算.自增自减.关系运算(比较).逻辑运算.短路逻辑运算.三元运算) 三元运算符案例(2只老虎:2个变量比较.三个和尚:3个变量比较) 键 ...
JAVA基础内容拓展链接汇总
JAVA基础内容拓展链接汇总 Java基础部分需要学习很多的内容,其实学习就是一个逐步深入递进的过程从易到难,我们可以进行进一步的拓展希望本文可以帮助到你,本文是程序媛泡泡给大家总结的链接汇总,欢 ...
小汤学编程之JAVA基础day14——xml和反射
一.xml 1.简介 2.特点 3.使用步骤二.Reflect反射 1.概念 2.理解Class类 3.反射的功能 4.两个案例一.xml 1.简介 xml ...