XML语言
在XML语言中,它允许用户自定义标签。一个标签用于描述一段数据,一个标签可以分为开始标签和接收标签,在开始标签和结束标签之间,又可以使用其他标签描述其他数据,以此来实现数据的关系的描述
Xml技术除了用于保存有关系的数据之外,它还经常用作软件配置文件,以描述程序模块之间的关系
在一个软件系统中,为提高系统的灵活性,它所启动的模块通常由其配置文件决定的
例如:在一个软件启动时,它需要启动A、B两个模块,而A、B这两个模块在启动时,又分别需要A1、A2和B1、B2模块的支持,为了准确的描述这种关系,此时使用xml语言最为合适不过。
一个xml文件分为:文档声明、元素、属性、注释、CDATA区,特殊字符、处理指令(processing instruction)
文档声明:
最简单的声明语法:<?xml version=”1.0” ?> ——>这句话表明这个是xml文档,当前遵循的版本号是1.0的xml规范
用encoding属性说明文档的字符编码的:
<?xml version=”1.0” encoding=”GB2312” ?> ——>假如这个文档里一旦有中文的话,一定要通过encoding=”GB2312”告诉解析引擎,就是解析器,用GB2312编码处理中文
记事本的码表是GB2312
如果你的xml语言是用记事本写的,那么如果你写的encoding=”UTF-8”,在保存时就应该点击另保存,而不是保存了,选另保存中的字符集为UTF-8,这是因为记事本默认的码表是GB2312,也就是你在用记事本保存时,这些保存到硬盘中,硬盘中保存的是0或1,在保存中记事本必须把中文翻译成0和1组成的字符码,这时就必须查码表,如果你没有指定计时本查那个码表,那么记事本就会选择默认的码表GB2312,当我们用IE打开时,IE 读硬盘,要把硬盘中的字符变成文字,这个时候IE会使用指定的码表UTF-8,就会去查UTF-8,则会出现乱码,IE浏览器则也会显示乱码,并且会拒绝显示。如果想正确打开,那么在你保存时就要保存为UTF-8。
用standalone属性说明文档是否是独立的:
<?xml version=”1.0” encoding=”GB23122” standalone=”yes” ?>
IE浏览器不关注standalone这个属性,也就是说即使你写的standalone=”no”也会打开,不会出现错误
Tip:元素(1)
Xml元素指xml文件中的标签,一个标签分为开始标签和结束标签,一个标签有如下几种书写形式,例如:
包含标签体:<a> http://blog.sina.com.cn/u/2096455054</a>
不包含标签体的:<a></a>,简写为:<a/>
一个标签中也可以嵌套若干子标签,但所有的标签必须合理的嵌套,决不允许交叉嵌套例如:<a>Welcone to<b> http://blog.sina.com.cn/u/2096455054</a></b>
格式良好的xml文档必须有且仅有一个根标签,其他的标签都是这个根标签的子孙标签。
Tip:元素(2)
对于xml标签中出现的所有空格和换行,xml解析程序都会当做标签内容进行处理例如:<网址> http://blog.sina.com.cn/u/2096455054</网址>和下面的是不一样的
<网址>
http://blog.sina.com.cn/u/2096455054
</网址>
由于在xml中,空格和换行都作为原始内容被处理,所以,在编写xml文件时,使用换行和缩进等方式来让源文件中的内容清晰可读的“良好”书写习惯可能要被迫改变
Tip:元素(3)——命名规范
一个xml元素可以包含字母、数字以及其他一些可见字符,但必须遵守下面的一些规范:
区分大小写,例如:<P>和<p>是两个不同的标记
不能以数字或“_”(下划线)开头
不能以xml(或XML、或Xml等)开头
不能包含空格
名称中间不能包含冒号(:)
Tip:属性
一个标签可以有多个属性,每个属性都有他自己的名称和取值,例如:
<input name=”text”>
属性值一定要用双引号(“)或单引号(‘)引起来
定义属性必须遵循与标签相同的命名规范
在xml技术中,标签属性所代表的信息,也可以被改成用子元素的形式来描述例如:
<input>
<name>text</name>
</input>
Tip:注释
Xml文件中的注释采用:<!—注释-->格式
注意:
Xml声明之前不能有注释:
注释不能嵌套。例如: <!--....<!--...-->.....-->
Tip:CDATA区
在编写xml文档时,有些内容可能不想让解析引擎解析执行,而是当做原始内容处理
遇到此种情况时,可以把这些内容放在CDATA区中,对于CDATA区域内的内容,xml解析程序不会处理,而是直接原封不动的输出
语法:<![CDATA[内容]]>
<![CDATA[
<itcast>
<br/>
</itcast>
]]>
Tip:处理指令
处理指令,简称PI。处理指令用来指挥解析引擎如何解析xml文档内容的。例如:在xml文档中可以使用xml-stylesheet指令,通知xml解析引擎,应用css文件显示xml文档内容。
处理指令必须 以“<?“作为开头,以”?>“作为结尾,xml声明语句就是最常见的一种处理指令
Xml常用的约束技术:
XML DTD(文档类型定义) 和 XML Schema
Tip:编写DTD约束的两种方式
DTD约束既可以作为一个单独的文件编写,也可以在xml文件内编写。
Tip:引用DTD约束
Xml文件使用DOCTYPE声明语句来指明它所遵循的DTD文件,DOCTYPE声明语句有两种形式:
当引用的文件在本地时,采用如下方式:
<!DOCTYPE 文档根节点SYSTEM "DTD文件的URL">>
当引用的文件是一个公共的文件时,采用如下形式:
<!DOCTYPE 文档根节点 PUBLIC “DTD名称” “DTD文件的URL”>
Tip:DTD的语法细节:元素定义1
在DTD文档中使用ELEMENT声明一个xml元素,语法格式如下所示:<!ELEMENT 元素名称 元素类型>
元素类型可以是元素内容、或类型
如为元素内容:则需要使用()括起来,如<!ELEMENT 书架 (书名,作者,售价)>
如为元素类型,则直接书写,DTD规范定义了如下几种类型:
EMPTY:用于定义空元素。例如<br/> <hr/>
ANY:表示元素内容为任意类型。
Tip:DTD的语法细节:元素定义2
元素内容可以使用如下方式,描述内容的组成关系
用逗号分隔,表示内容的出现顺序必须与声明时一致。
<!ELEMENT MYFILE(TITLE,AUTHOR,EMAIL)>
用|分隔,表示任选其一,即多个只能出现一个
<!ELEMENT MYFILE(TITLE|AUTHOR|EMAIL)>
在元素内容中也可以使用+、*、?等符号表示元素出现的次数:
+:一次或多次(书+)
?:0次或一次(书?)
*:0次或多次(书*)
也可以使用()批量设置例:
<!ELEMENT MYFILE((TITLE*,AUTHOR?,EMAIL)*|COMMENT)>
Tip:属性定义
Xml文档中的标签属性通过ATTLIST为其设置属性
语法格式:
<!ATTLIST 元素名
属性名1 属性值类型 设置说明
属性名2 属性值类型 设置说明
>
属性声明举例:
<!ATTLIST 商品
类别 CDATA #REQUIRED
颜色 CDATA #IMPLIED
>
对应的xml文件:
<商品 类别=”服装” 颜色=””黄色>..</商品>
设置说明:
#REQUIRED:必须设置该属性
#IMPLIED:可以数值也可以不设置
#FIXED:说明该属性的取值固定为一个值,在xml文件中不能为该属性设置其它值,但需要为该属性提供这个值
直接使用默认值:在xml中可以设置该值也可以不设置该属性值,若没设置则使用默认值。
<!ATTLIST 页面作者
姓名 CDATA #IMPLIED
年龄 CDATA #IMPLIED
联系信息 CDATA #REQUIRED
网站职务 CDATA #FIXED “页面作者”
个人爱好 CDATA “上网”
>
Tip:常用属性值类型:
CDATA:表示属性值为普通文本字符串
ENUMERATED:表示枚举
ID:表示ID值
ENTITY(实体)
Tip:属性值类型->ENUMERATED
属性的类型可以是一组取值的列表,在xml文件中设置的属性值只能是这个列表中的某个值(枚举)
<?xml version=”1.0” encoding=”GB2312” standalone=”yes”>
<!DOCTYPE 购物篮 [
<!ELEMENT 肉 EMPTY>
<!ELEMENT 肉 品种 (鸡肉 | 牛肉 | 猪肉 | 鱼肉 ) “鸡肉”>
]>
<购物篮>
<肉 品种=”鱼肉” />
<肉 品种=”牛肉” />
<肉/>
</购物篮>
Tip:属性值类型àID
表示属性的设置为唯一值
ID属性的值只能由字母,下划线开始,不能出现空白符
<?xml version=”1.0” encoding=”GB2312”>
<!DOCTYPE 联系人列表[
<!ELEMENT 联系人列表 ANY>
<!ELEMENT 联系人(姓名,EMAIL)>
<!ELEMENT 姓名(#PCDATA)>
<!ELEMENT EMALL(#PCDATA)>
<!ATTLIST 联系人 编号 ID #REQUIRED>
]>
<联系人列表>
<联系人 编号=”1”>
<姓名>张三</姓名>
<EMAIL>ZHANGSAN@IT315.ORG<EMAIL>
</联系人>
</联系人列表>
Tip:实体定义
实体用于为一段内容创建一个别名,以后再xml文档中就可以使用别名引用这段内容了
在DTD定义中,一条<!ELEMENT….>语句用于定义一个实体,
实体分为两种类型:引用实体和参数实体
Tip:实体定义->参数实体
参数实体被DTD文件自身使用
语法格式:<!ENTITY % 实体名称 “实体内容“>
引用方式:%实体名称
举例1:<!ELEMENT TAG_NAMES “姓名 |EMAIL |电话 |地址“>
<!ELEMENT 个人信息(%TAG_NAMES;|生日)>
<!ELEMENT 客户信息 (%TAG_NAMES; |公司名)>
举例2:<!ENTITY % common.attributes
“ id ID #IMPLIED
Account CDATA #REQUIRED”
>