关于XML文档的讲解
1 XML的概述
1.1 什么是XML
XML全称为Extensible Markup Language,意思是可扩展的标记语言。XML语法上和HTML比较相似,但HTML中的元素是固定的,而XML的标签是可以由用户自定义的。
W3C在1998年2月发布1.0版本,2004年2月又发布1.1版本,但因为1.1版本不能向下兼容1.0版本,所以1.1没有人用。同时,在2004年2月W3C又发布了1.0版本的第三版。我们要学习的还是1.0版本!!!
1.2 XML的应用场景
保存关系型数据:
<student number="1001"><name>zhangSan</name><age>23</age><sex>male</sex><teacher name=”liSi”><wife id=”xxx”><name>xxx</name></wife></teacher></student>
配置文件:
<servlet><servlet-name>MyServlet</servlet-name><servlet-class>cn.itcast.servlet.MyServlet</servlet-class></servlet>
l 在一个软件系统中,为提高系统的灵活性,它所启动的模块通常由其配置文件决定
l 例如一个软件在启动时,它需要启动A、B两个模块,而A、B这两个模块在启动时,又分别需要A1、A2和B1、B2模块的支持,为了准确描述这种关系,此时使用XML文件最为合适不过。
来看一个XML文档
students.xml
<?xml version="1.0" encoding="utf-8" standalone="no"?> <students> <student number="1001"><name>zhangSan</name><age>23</age><sex>male</sex></student><student number="1002"><name>liSi</name><age>32</age><sex>female</sex></student><student number="1003"><name>wangWu</name><age>55</age><sex>male</sex></student> </students>
2.1 XML文档声明
l 文档声明必须为<?xml开头,以?>结束;
l 文档声明必须从文档的0行0列位置开始;
l 文档声明只有三个属性:
- versioin:指定XML文档版本。必须属性,因为我们不会选择1.1,只会选择1.0;
- encoding:指定当前文档的编码。可选属性,默认值是utf-8;
- standalone:指定文档独立性。可选属性,默认值为yes,表示当前文档是独立文档。如果为no表示当前文档不是独立的文档,会依赖外部文件。
l 一个XML文件分为如下几部分内容:
l 文档声明
l 元素
l 属性
l 注释
l CDATA区 、特殊字符
l 处理指令(processing instruction)
XML语法-文档声明
l 在编写XML文档时,需要先使用文档声明,声明XML文档的类型。
l 最简单的声明语法:
<?xml version="1.0" ?>
l 用encoding属性说明文档的字符编码:
<?xml version="1.0" encoding="GB2312" ?>
l 用standalone属性说明文档是否独立:
<?xml version="1.0" encoding="GB2312" standalone="yes" ?>
2.2 元素
元素是XML文档中最重要的组成部分:
l 普通元素的结构:开始标签、元素体、结束标签,例如:<hello>大家好</hello>;
l 元素体:元素体可以是元素,也可以是文本,例如:<b><a>你好</a></b>,其中<b>元素的元素体是<a>元素,而<a>元素的元素体是文本;
l 空元素:空元素只有开始标签,而没有结束标签,例如:<c/>,当元素必须自己闭合。
3 属性
<student number="1001"><name>zhangSan</name><age>23</age><sex>male</sex></student>
l 属性是元素的一部分,它必须出现在元素的开始标签中;
l 属性的定义格式:属性名=属性值,其中属性值必须使用单引或双引;
l 一个元素可以有0~N个属性,但一个元素中不能出现同名属性;
4 注释
XML的注释与HTML相同,即以“<!--”开始,以“-->”结束。注释内容会被XML解析器忽略!
5 转义字符和CDATA段<![CDATA[
]]>
5.1 转义字符
XML中的转义字符与HTML一样。
因为很多符号已经被XML文档结构所使用,所以在元素体或属性值中想使用这些符号就必须使用转义字符,例如:“<”、“>”、“’”、“””、“&”。
例如:<a><hello></a>,<a>元素内部会被解释为:<hello>!
5.2 CDATA段
当大量的转义字符出现在xml文档中时,会使xml文档的可读性大幅度降低。这时如果使用CDATA段就会好一些。
在CDATA段中出现的“<”、“>”、“””、“’”、“&”,都无需使用转义字符。这可以提高xml文档的可读性。
<a><![CDATA[<a>]]></a>
在CDATA段中不能包含“]]>”,即CDATA段的结束定界符。
6 处理指令(了解即可)
处理指令,简称PI(Processing instruction)。处理指令用来指挥解析器如何解析XML文档内容。
例如,在XML文档中可以使用xml-stylesheet指令,通知XML解析器,应用css文件显示xml文档内容。
<?xml-stylesheet type="text/css" href="a.css"?>
处理指令以“<?”开头,以“?>”结束,这一点与xml文档声明相同。
gj1 {font-size: 200px; color: red;} gj2 {font-size: 100px; color: green;} gj3 {font-size: 10px;} gj4 {font-size: 50px; color: blue;} <?xml version="1.0" encoding="gbk"?> <?xml-stylesheet type="text/css" href="a.css" ?> <gjm><gj1>中国</gj1><gj2>美国</gj2><gj3>日本</gj3><gj4>英国</gj4> </gjm>
7 格式良好的XML文档
格式良好的XML就是格式正确的XML文档,只有XML的格式是良好的,XML解释器才能解释它。下面是对格式良好XML文档的要求:
l 必须要有XML文档声明;
l 必须且仅能有一个根元素;
l 元素和属性的命名必须遵循XML要求:
- XML命名区分大小写,例如<a>和<A>是两个不同的元素;
- 名称中可以包含:字母、数字、下划线、减号,但不能以数字、减号开头;
- 不能以xml开头,无论是大写还是小写都不可以,例如<xml>、<Xml>、<XML>都是错误的;
- 不能包含空格,例如<ab cd>是错误的。
l 元素之间必须合理包含,例如:<a><b>xxx</b></a>是合理的,而<a><b>xxx</a></b>就是错误的包含。
关于XML文档的讲解相关推荐
- 掌握XML系列(四)---创建格式良好的XML文档
掌握XML系列(四)---创建格式良好的XML文档 前言:创建良好格式的XML文档,虽然写了这些,其实,等到大家真正的看完之后美酒会发现,其实也很简单的,我们这里所做的是带着大家全面的看看怎么样创建. ...
- 用Castor 处理XML文档
--Castor可以完成Java和XML的相互转换 前面有介绍过json-lib这个框架,在线博文:http://www.cnblogs.com/hoojo/archive/2011/04/21/20 ...
- 用Castor处理XML文档
--Castor可以完成Java和XML的相互转换 前面有介绍过json-lib这个框架,在线博文:http://www.cnblogs.com/hoojo/archive/2011/04/21/20 ...
- java中sax的使用_java使用sax对xml文档的解析
随着互联网技术的发展,XML技术变得越来越重要,从而出现了很多 与XML的整合应用方面的技术,SAX就是其中之一.在这里,我就简要 谈谈java怎样使用sax对xml文档的解析. 首先,让我们来谈谈S ...
- XML 解析XML文档 XML约束
XML 什么是XML Extensible Markup Language(可扩展的标记语言) 他是一个语言,有自己的语法,和Java以及其他的编程无关 "标记" 在文件中包含类似 ...
- 《Java核心技术 卷Ⅱ 高级特性(原书第10版)》一3.7.5 使用StAX写出XML文档
3.7.5 使用StAX写出XML文档 在前一节中,你看到了如何通过写出DOM树的方法来产生XML文件.如果这个DOM树没有其他任何用途,那么这种方式就不是很高效. StAX API使我们可以直接将X ...
- SAX解析XML文档——(二)
SAX从上向下解析,一行一行解析.节省内存,不适合CRUD. XML文档: <?xml version="1.0" encoding="UTF-8"?&g ...
- 【学习笔记】关于DOM4J:使用DOM4J解析XML文档
一.概述 DOM4J是一个易用的.开源的库,用于XML.XPath和XSLT中.采用了Java集合框架并完全支持DOM.SAX.和JAXP. DOM4J最大的特色是使用大量的接口,主要接口都在org. ...
- Element 对象表示 XML 文档中的元素。
Element 对象 Element 对象表示 XML 文档中的元素.元素可包含属性.其他元素或文本.如果元素含有文本,则在文本节点中表示该文本. 重要事项:文本永远存储在文本节点中.在 DOM 处理 ...
最新文章
- 综述|计算机视觉中的注意力机制
- oracle 9i net基本配置
- linux rpm 怎么解压缩,dpkg rpm apt yum 的常用指令 +linux 各种解压缩方法
- 任意文件读取及删除漏洞
- 【转载】前后端分离的思考与实践(二)
- win10计算机扫描,win10系统测试一体机扫描仪功能的解决教程
- 7——1 shelve 模块
- php连接池 php–cp
- linux sed批量更改文件,Linux利用sed批量修改文件名(示例代码)
- IOS UIScrollView 学习记录
- WordPress主题插件Modown6.1绿色版+Erphpdown11.6等多插件
- 你有必要不沾计算机一段时间英语,八年级英语下册第一单元词组
- [论文导读]Restoring and attributing ancient texts using deep neural networks深度学习复原古希腊铭文
- 【MODIS数据处理#11】例六:绘制NDVI多年变化趋势空间分布图
- Django搭建网站的个人笔记记录
- Python游戏编程(五)Tic Tac Toe
- PTA基础编程题目集1-6题答案
- Drawable转Bitmap,Bitmap#getPixel像素为0的解决办法
- 乔戈里带你0元白嫖阿里云服务器指南
- Hibernate高级映射技术(一)自定义数据类型StringList (转载用于收藏)
热门文章
- springboot如何使用outlook发送邮件
- 云发布的Docker部署文档
- [附源码]计算机毕业设计Python+uniapp家电维修微信小程序z8jl5(程序+lw+远程部署)
- C++不知算法系列之集结常规算法思想
- 早报:华为Mate30发布会结束,各项参数汇总,你是否会选择入手
- CSS3学习(五):display 属性
- 我,一个写代码的(转载)
- python xlrd用法_python3 xlrd包的用法
- python xlrd Excel xlsx file; not support
- 布林线均值回归(股票)——Python量化