目录
发展历史
XML和HTML对比之可扩展
XML和HTML对比之语法细节
XML验证之DTD
XML名称空间
XML语法结构
DOM4J读写配置文件
关于SLT
XML语法结构
<?xmlversion="1.0" encoding="gb2312"standalone="no"?> <!DOCTYPEstudent SYSTEM "test.dtd"> <!--这是XML文档--> <student> <name>张三</name> <age>24</age> </student>
上面是一个基本的XML,我们就以这个为例来详细说明XML文档的结构和语法。
XML声明(第1行)
XML文档总是以一个XML声明开始,其中指明所用的XML版本、文档的编码、文档的独立性信息。
其格式为:<?xml 版本信息[编码信息][文档独立性信息]?>,其中,括号([])中的部分表示可选信息。
1.版本说明:<? xml version=”1.0”?>
需要注意的是前后都有问号,而且问号和括号中间能有空格,否则会出错。截至笔者发博客前XML的版本有两个1.0和1.1,不同的版本之间其实现细节是不一样的。当一个低版本的XML处理器解析一个高版本的XML文档的时候可能会碰到一些不能识别的符号或语法,从而导致解析的结果不正确。通过在XML文档的开始处写上XML声明,XML处理器就可以根据声明来判断该文档所遵守的XML规范,如果遇到不支持的版本就不再解析处理,会直接给出错误信息。
2.文档编码声明
在XML声明中还可以加上文档编码信息,默认是UTF-8,如果要使用中文,可以在声明中加上encoding=”gb2312”需要注意的是XML编辑时的编码和encoding属性的编码要对应,否则会报如下错误“不支持从当前编码到指定编码的切换。处理资源……”。
例如:用记事本保存XML为ANSI时encoding的属性应为gb2312;当用记事本保存为UTF-8时encoding属性应为UTF-8,其他编码同理。
3.独立文档声明
如果我们的文档不依赖于外部文档,在XML声明中,可以通过standalone=“yes”来声明这个文档是独立的文档。如果文档依赖于外部文档,可以通过standalone=“no”来声明。完整的XML声明如下所示:<?xmlversion=”1.0” encoding=”gb2312” standalone=”yes”?>
文档类型声明(第2行)
通过前面文章的介绍,我们知道可以用DTD(Document Type Definition,文档类型定义)来规范XML文档。XML从SGML继承了用于定义语法规则的DTD机制,但DTD本身并不要求遵循XML规则,几乎所用的XML应用都是使用DTD来定义的.HTML就有一个标准的DTD文件,苏伊其组织结构和所有的标签都是固定的。DTD文件也是一个文本文件,通常用“.dtd”作为其扩展名。
而指出XML文档所用的DTD就是通过文档类型声明。文档类型声明有两种方式,一种是声明DTD在一个外部文件中,另一中是直接在XML文档中给出DTD。(关于具体DTD的内容见上一篇文章)
元素
在XML中元素由开始标签、元素内容和结束标签构成。空元素则由空元素标签构成。每一个元素都有一个用名字标志的类型,同时它可以有一个属性说明集,每一个属性说明有一个名字和一个值。
在给元素命名的时候要注意,以“xml”或其他任何匹配的字符开头的名字都保留用于XML规范的当前版本或后续版本的标准化。另外,在给元素命名时还需要注意以下几点:
1. 名称只能以字母、下划线,或者冒号开头。
2. 名称中不能包含空格。
3. 不要引起歧义
注释(第3行)
注释可以帮助我们更好的阅读文档,在注释当中几乎可以写一切帮助我们阅读的字符,但是为了避免XML编辑器引起歧义,在写注释的时候需要注意一下几点
1.不能出现在XML声明之前,XML声明必须是文档最前面的部分。
2.注释不能出现在标记中
3.注释可以包围和隐藏标记,但要注意的是,在注释掉标记之后,要保证剩余的文本仍然是一个结构完整的XML文档。
4.字符串“--”(双连接字符)不能在注释中出现。
5.在XML中不允许注释以“-->”结尾。
小技巧
其实判断命名或者注释是否规范的最好办法就是用浏览器将写好的XML打开,如果可以打开说明命名没有问题,否则需要根据提示修改XML文件,直到能用浏览器正常打开为止。
以上就是XML简明教程(6)的内容,更多相关内容请关注PHP中文网(www.php.cn)!