加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 百科 > 正文

XML详解---1

发布时间:2020-12-15 22:35:46 所属栏目:百科 来源:网络整理
导读:1.1 什么是 XML XML 全称为 ExtensibleMarkupLanguage ,意思是可扩展的标记语言。 XML 语法上和 HTML 比较相似,但 HTML 中的元素是固定的,而 XML 的标签是可以由用户自定义的。 W3C 在 1998 年 2 月发布 1.0 版本, 2004 年 2 月又发布 1.1 版本,但因为

1.1 什么是XML

XML全称为ExtensibleMarkupLanguage,意思是可扩展的标记语言。XML语法上和HTML比较相似,但HTML中的元素是固定的,而XML的标签是可以由用户自定义的。

W3C19982月发布1.0版本,20042月又发布1.1版本,但因为1.1版本不能向下兼容1.0版本,所以1.1没有人用。同时,在20042W3C又发布了1.0版本的第三版。我们要学习的还是1.0版本!!!

1.2XML的应用场景

  保存关系型数据:

  <studentnumber="1001">

<name>zhangSan</name>

<age>23</age>

<sex>male</sex>

<teachername=”liSi”>

<wifeid=”xxx”><name>xxx</name></wife>

</teacher>

</student>

配置文件:

  <servlet>

<servlet-name>MyServlet</servlet-name>

<servlet-class>cn.itcast.servlet.MyServlet</servlet-class>

</servlet>

2XML语法

来看一个XML文档

students.xml

<?xmlversion="1.0"encoding="utf-8"standalone="no"?>

<students>

<studentnumber="1001">

<name>zhangSan</name>

<age>23</age>

<sex>male</sex>

</student>

<studentnumber="1002">

<name>liSi</name>

<age>32</age>

<sex>female</sex>

</student>

<studentnumber="1003">

<name>wangWu</name>

<age>55</age>

<sex>male</sex>

</student>

</students>

2.1XML文档声明

l文档声明必须为<?xml开头,以?>结束;

l文档声明必须从文档的00列位置开始;

l文档声明只有三个属性:

?versioin:指定XML文档版本。必须属性,因为我们不会选择1.1,只会选择1.0

?encoding:指定当前文档的编码。可选属性,默认值是utf-8

?standalone:指定文档独立性。可选属性,默认值为yes,表示当前文档是独立文档。如果为no表示当前文档不是独立的文档,会依赖外部文件。

2.2 元素

元素是XML文档中最重要的组成部分:

l普通元素的结构:开始标签、元素体、结束标签,例如:<hello>大家好</hello>

l元素体:元素体可以是元素,也可以是文本,例如:<b><a>你好</a></b>,其中<b>元素的元素体是<a>元素,而<a>元素的元素体是文本;

l空元素:空元素只有开始标签,而没有结束标签,例如:<c/>,当元素必须自己闭合。

3 属性

<studentnumber="1001">

<name>zhangSan</name>

<age>23</age>

<sex>male</sex>

</student>

l属性是元素的一部分,它必须出现在元素的开始标签中;

l属性的定义格式:属性名=属性值,其中属性值必须使用单引或双引;

l一个元素可以有0~N个属性,但一个元素中不能出现同名属性;

4 注释

  XML的注释与HTML相同,即以“<!--”开始,以“-->”结束。注释内容会被XML解析器忽略!

5 转义字符和CDATA

5.1 转义字符

XML中的转义字符与HTML一样。

因为很多符号已经被XML文档结构所使用,所以在元素体或属性值中想使用这些符号就必须使用转义字符,例如:“<”、“>”、“’”、“””、“&”。

例如:<a><hello></a><a>元素内部会被解释为:<hello>

5.2CDATA

当大量的转义字符出现在xml文档中时,会使xml文档的可读性大幅度降低。这时如果使用CDATA段就会好一些。

CDATA段中出现的“<”、“>”、“””、“’”、“&”,都无需使用转义字符。这可以提高xml文档的可读性。

<a><![CDATA[<a>]]></a>

CDATA段中不能包含“]]>”,即CDATA段的结束定界符。

6 处理指令(了解即可)

处理指令,简称PIProcessinginstruction)。处理指令用来指挥解析器如何解析XML文档内容。

例如,在XML文档中可以使用xml-stylesheet指令,通知XML解析器,应用css文件显示xml文档内容。

<?xml-stylesheettype="text/css"href="a.css"?>

处理指令以“<?”开头,以“?>”结束,这一点与xml文档声明相同。

gj1{font-size:200px;color:red;}

gj2{font-size:100px;color:green;}

gj3{font-size:10px;}

gj4{font-size:50px;color:blue;}

<?xmlversion="1.0"encoding="gbk"?>

<?xml-stylesheettype="text/css"href="a.css"?>

<gjm>

<gj1>中国</gj1>

<gj2>美国</gj2>

<gj3>日本</gj3>

<gj4>英国</gj4>

</gjm>

7 格式良好的XML文档

格式良好的XML就是格式正确的XML文档,只有XML的格式是良好的,XML解释器才能解释它。下面是对格式良好XML文档的要求:

l必须要有XML文档声明;

l必须且仅能有一个根元素;

l元素和属性的命名必须遵循XML要求:

?XML命名区分大小写,例如<a><A>是两个不同的元素;

?名称中可以包含:字母、数字、下划线、减号,但不能以数字、减号开头;

?不能以xml开头,无论是大写还是小写都不可以,例如<xml><Xml><XML>都是错误的;

?不能包含空格,例如<abcd>是错误的。

l元素之间必须合理包含,例如:<a><b>xxx</b></a>是合理的,而<a><b>xxx</a></b>就是错误的包含。

DTD

1DTD概述

1.1 什么是DTD

DTDDocumentTypeDefinition),文档类型定义,用来约束XML文档。或者可以把DTD理解为创建XML文档的结构!例如可以用DTD要求XML文档的根元素名为<students><students>中可以有1~N<student><student>子元素为<name><age><sex><student>元素还有number属性。

DTD不是XML文档,它是XML文档的约束文件!就像法律与人一样!

展示DTD文档

<!ELEMENTstudents(student+)>

<!ELEMENTstudent(name,age,sex)>

<!ELEMENTname(#PCDATA)>

<!ELEMENTage(#PCDATA)>

<!ELEMENTsex(#PCDATA)>

1.2DTD分类

l内部DTD:在XML文档内部嵌入DTD,只对当前XML文档有效;

l外部DTD:独立的DTD文件,扩展名为.dtd

?本地DTDDTD文件在本地,不在网络上。自己项目,或本公司内部使用的;

?公共DTDDTD文件在网络上,不在本地。都是大公司或组织发布的,共大家使用!

1.3 内部DTD

内部DTD

<?xmlversion="1.0"encoding="utf-8"standalone="yes"?>

<!DOCTYPEstudents[

<!ELEMENTstudents(student+)>

<!ELEMENTstudent(name,sex)>

<!ELEMENTname(#PCDATA)>

<!ELEMENTage(#PCDATA)>

<!ELEMENTsex(#PCDATA)>

]>

<students>

<student>

<name>zhangSan</name>

<age>23</age>

<sex>male</sex>

</student>

</students>

l位置:内部DTD在文档声明下面,在根元素上面;

l语法格式:放到“<!DOCTYPE根元素名称[”和“]>”之间;

l只对当前XML文档有效;

1.4SYSTEMDTD

本地DTD

<?xmlversion="1.0"encoding="utf-8"standalone="no"?>

<!DOCTYPEstudentsSYSTEM"students.dtd">

<students>

<student>

<name>zhangSan</name>

<age>23</age>

<sex>male</sex>

</student>

</students>

students.dtd

<!ELEMENTstudents(student+)>

<!ELEMENTstudent(name,sex)>

<!ELEMENTname(#PCDATA)>

<!ELEMENTage(#PCDATA)>

<!ELEMENTsex(#PCDATA)>

l位置:本地硬盘上;

l语法格式:直接定义元素或属性即可;

l本地所有XML文档都可以引用这个dtd文件;

1.5 公共DTD

公共DTD

<?xmlversion="1.0"encoding="utf-8"standalone="no"?>

<!DOCTYPEstudentsPUBLIC"-//qdmmy6//DTDST1.0//ZH""http://www.qdmmy6.com/xml/dtds/st.dtd">

<students>

<student>

<name>zhangSan</name>

<age>23</age>

<sex>male</sex>

</student>

</students>

公共DTD是说,DTD由某个公司或权威组织发布的,供大家使用的DTD。其格式如下:

<!DOCTYPE根元素PUBLIC"DTD名称""DTD网址">

当然你需要知道要使用的DTD的名称和网址。如果某个机构公布了DTD,那么一定也会公布DTD的名称和网址。

2DTD语法之定义元素

2.1 定义元素语法

定义元素语法:<!ELEMENT元素名元素描述>

l<!ELEMENTname(#PCDATA)>,定义名为name的元素,内容为文本类型。

l<!ELEMENTstudent(name,sex)>,定义名为student元素,内容依次为nameagesex元素;

l<!ELEMENTstudentANY>,定义名为student元素,内容任意;

l<!ELEMENTstudentEMPTY>,定义名为student元素,不能有内容,即空元素,注意空元素是可以有属性的。

2.2 子元素出现次数

可以使用*+?来指定子元素出现的次数

l*:可以出现0~N次;

l+:可以出现1~N次;

l?:可以出现0~1次。

例如:<!ELEMENTstudent(name,age?,hobby*,grade+)>,定义student元素,第一子元素为name,必须且仅能出现一次,age是可有可无的,hobby可以出现0~N次,grade可以出现1~N次。

2.3 枚举类型子元素

<!ELEMENTstudent(name|age|sex)>,表示student子元素为nameagesex其中之一,必须仅且能选择其一。

2.4 练习

l根元素为students,可以包含1~Nstudent元素;

lstudent元素依次包含:nameagesex元素;

lname、agesex元素的内容类型为文本内容;

l要求SYSTEM外部DTD

3DTD语法之定义属性

3.1 定义属性的语法

<!ATTLIST元素名属性名属性类型设置说明>

例如:<!ATTLISTstudentnumberCDATA#REQUIRED>,给student元素定义属性number,类型为文本,这个默认是必须的。

3.2 属性设置说明

l#REQUIRED:说明属性是必须的;

l#IMPLIED:说明属性是可选的;

l默认值:在不给出属性值时,使用默认值。

3.3 属性的类型

lCDATA:文本类型;

lEnumerated:枚举类型;

lID:ID类型,ID类型的属性用来标识元素的唯一性,即元素的ID属性值不能与其他元素的ID属性值相同;

lIDREF:ID引用类型,用来指定另一个元素,与另一个元素建立关联关系,IDREF类型的属性值必须是另一个元素的ID

<!ELEMENTstudents(student+)>
<!ELEMENTstudentEMPTY>
<!ATTLISTstudentnumberID#REQUIRED>
<!ATTLISTstudentnameCDATA#REQUIRED>
<!ATTLISTstudentsex(male|female)"male">
<!ATTLISTstudentfriendIDREF#IMPLIED>

<?xmlversion="1.0"?>
<!DOCTYPEstudentsSYSTEM"students.dtd">

<students>
<studentnumber="itcast_001"name="zhangSan"/>
<studentnumber="itcast_002"name="liSi"sex="male"/>
<studentnumber="itcast_003"name="wangWu"sex="female"friend="itcast_002"/>
</students>

4DTD语法之定义实体(了解)

4.1 什么是实体

有时在XML中会出现很多相同的内容,例如“北京传智播客教育科技有限公司”,这个名称太长了,我们希望把这个值与一个“符号”绑定,然后在需要这个名称时使用它绑定的“符号”即可。这个符号就是实体了。例如:“&传智;”!

其中“传智”是实体名,而“北京传智播客教育科技有限公司”是实体值,XML被解析时,所有实体会被替换成实体名。

4.2 实体分类

实体分为两种:一般实体和参数实体。

l一般实体:在XML文档中使用;

l参数实体:在DTD使用。

4.3 一般实体

l定义一般实体:<!ENTITY实体名“实体值”>,例如:<!ENTITY大美女“白冰”>

l一般实体引用:&实体名;,例如<xxx>&大美女;</xxx>

<?xmlversion="1.0"encoding="utf-8"standalone="no"?>

<!DOCTYPEstudentsSYSTEM"a.dtd">

<students>

<studentnumber="itcast_001"name="zhangSan"/>

<studentnumber="itcast_002"name="liSi"sex="male"/>

<studentnumber="itcast_003"name="wangWu"sex="female"friend="itcast_002"/>

<studentnumber="itcast_004"name="&itcast;"/>

</students>

<!ELEMENTstudents(student+)>

<!ELEMENTstudentEMPTY>

<!ATTLISTstudentnumberID#REQUIRED>

<!ATTLISTstudentnameCDATA#REQUIRED>

<!ATTLISTstudentsex(male|female)"male">

<!ATTLISTstudentfriendIDREF#IMPLIED>

<!ENTITYitcast"北京传智播客教育科技有限公司">

4.4 参数实体

l定义参数实体:<!ENTITY%实体名"实体值">,“%”与实体名之间的空格是必须的;

?例如:<!ENTITY%friend"studentfriendIDREF#IMPLIED">

l参数实体引用:%实体名;

?例如:<!ATTLIST%friend;>

参数实体是在DTD内部使用,而不是在XML中使用。

在内部DTD中使用参数实体会有诸多限制。

<?xmlversion="1.0"encoding="utf-8"standalone="no"?>

<!DOCTYPEstudentsSYSTEM"a.dtd">

<students>

<studentnumber="itcast_001"name="zhangSan"/>

<studentnumber="itcast_002"name="liSi"sex="male"/>

<studentnumber="itcast_003"name="wangWu"sex="female"friend="itcast_002"/>

<studentnumber="itcast_004"name="&itcast;"/>

</students>

<!ELEMENTstudents(student+)>

<!ELEMENTstudentEMPTY>

<!ATTLISTstudentnumberID#REQUIRED>

<!ATTLISTstudentnameCDATA#REQUIRED>

<!ATTLISTstudentsex(male|female)"male">

<!ENTITY%friend"<!ATTLISTstudentfriendIDREF#IMPLIED>">

%friend;

<!ENTITYitcast"北京传智播客教育科技有限公司">

Schema

1Schema概述

1.1 什么是Schema

lSchema是新的XML文档约束;

lSchema要比DTD强大很多;

lSchema本身也是XML文档,但Schema文档的扩展名为xsd,而不是xml

1.2Schema简介

  本课程中不对Schema深入探讨,我们只对Schema有个了解即可。

students.xsd

<?xmlversion="1.0"?>
<xsd:schemaxmlns="http://www.itcast.cn/xml"
xmlns:xsd="http://www.w3.org/2001/XMLSchema"
targetNamespace="http://www.itcast.cn/xml"elementFormDefault="qualified">
<xsd:elementname="students"type="studentsType"/>
<xsd:complexTypename="studentsType">
<xsd:sequence>
<xsd:elementname="student"type="studentType"minOccurs="0"maxOccurs="unbounded"/>
</xsd:sequence>
</xsd:complexType>
<xsd:complexTypename="studentType">
<xsd:sequence>
<xsd:elementname="name"type="xsd:string"/>
<xsd:elementname="age"type="ageType"/>
<xsd:elementname="sex"type="sexType"/>
</xsd:sequence>
<xsd:attributename="number"type="numberType"use="required"/>
</xsd:complexType>
<xsd:simpleTypename="sexType">
<xsd:restrictionbase="xsd:string">
<xsd:enumerationvalue="male"/>
<xsd:enumerationvalue="female"/>
</xsd:restriction>
</xsd:simpleType>
<xsd:simpleTypename="ageType">
<xsd:restrictionbase="xsd:integer">
<xsd:minInclusivevalue="0"/>
<xsd:maxInclusivevalue="120"/>
</xsd:restriction>
</xsd:simpleType>
<xsd:simpleTypename="numberType">
<xsd:restrictionbase="xsd:string">
<xsd:patternvalue="ITCAST_d{4}"/>
</xsd:restriction>
</xsd:simpleType>
</xsd:schema>

students.xml

<?xmlversion="1.0"?>

<studentsxmlns="http://www.itcast.cn/xml"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation="http://www.itcast.cn/xmlstudents.xsd">
<studentnumber="ITCAST_1001">
<name>zhangSan</name>
<age>20</age>
<sex>male</sex>
</student>
<studentnumber="ITCAST_1002">
<name>liSi</name>
<age>25</age>
<sex>female</sex>
</student>
</students>

2Schema名称空间

2.1 什么是名称空间

如果一个XML文档中使用多个Schema文件,而这些Schema文件中定义了相同名称的元素时就会出现名字冲突。这就像一个Java文件中使用了importjava.util.*importjava.sql.*时,在使用Date类时,那么就不明确Date是哪个包下的Date了。

总之名称空间就是用来处理元素和属性的名称冲突问题,与Java中的包是同一用途。如果每个元素和属性都有自己的名称空间,那么就不会出现名字冲突问题,就像是每个类都有自己所在的包一样,那么类名就不会出现冲突。

2.2 目标名称空间

XSD文件中为定义的元素指定名称,即指定目标名称空间。这需要给<xsd:schema>元素添加targetNamespace属性。

l<xsd:schematargetNamespace="http://www.itcast.cn/xml">

名称空间可以是任意字符串,但通常我们会使用公司的域名作为名称空间,这与Java中的包名使用域名的倒序是一样的!千万不要以为这个域名是真实的,它可以是不存在的域名。

如果每个公司发布的Schema都随意指定名称空间,如ab之类的,那么很可能会出现名称空间的名字冲突,所以还是使用域名比较安全,因为域名是唯一的。

当使用了targetNamespace指定目标名称空间后,那么当前XSD文件中定义的元素和属性就在这个名称空间之中了。

2.3XML指定XSD文件

XML文件中需要指定XSD约束文件,这需要使用在根元素中使用schemaLocation属性来指定XSD文件的路径,以及目标名称空间。格式为:schemaLocation=”目标名称空间XSD文件路径

l<studentsschemaLocation="http://www.itcast.cn/xmlstudents.xsd">

schemaLocation是用来指定XSD文件的路径,也就是说为当前XML文档指定约束文件。但它不只要指定XSD文件的位置,还要指定XSD文件的目标名称空间。

其中http://www.itcast.cn/xml为目标名称空间,students.xsdXSD文件的位置,它们中间使用空白符(空格或换行)分隔。

也可以指定多个XSD文件,格式为:

lschemaLocation=”目标名称空间1XSD文件路径1目标名称空间2XSD文件路径2

下面是spring配置文件的例子,它一共指定两个XSD文件

<?xmlversion="1.0"encoding="UTF-8"?>
<beans
xsi:schemaLocation="http://www.springframework.org/schema/beans
http://www.springframework.org/schema/beans/spring-beans-3.0.xsd
http://www.springframework.org/schema/aop
http://www.springframework.org/schema/aop/spring-aop-3.0.xsd">
</beans>

下面是JavaWeb项目的配置文件:

<?xmlversion="1.0"encoding="UTF-8"?>
<web-appxsi:schemaLocation="http://java.sun.com/xml/ns/javaee
http://java.sun.com/xml/ns/javaee/web-app_2_5.xsd">
</web-app>

2.4 定义名称空间

现在我们已经知道一个XML中可以指定多个XSD文件,例如上面Spring的配置文件中就指定了多个XSD文件,那么如果我在<beans>元素中给出一个子元素<bean>,你知道它是哪个名称空间中的么?

<beans
xsi:schemaLocation="http://www.springframework.org/schema/beans
http://www.springframework.org/schema/beans/spring-beans-3.0.xsd
http://www.springframework.org/schema/aop
http://www.springframework.org/schema/aop/spring-aop-3.0.xsd">

<bean></bean>
</beans>

所以只是使用schemaLocation指定XSD是不够的,它只是导入了这个XSDXSD的名称空间而已。schemaLocation的作用就相当于Java中导入Jar包的作用!最终还是在Java文件中使用import来指定包名的。

xmlns是用来指定名称空间前缀的,所谓前缀就是“简称”,例如中华人发共和国简称中国一样,然后我们在每个元素前面加上前缀,就可以处理名字冲突了。

格式为:xmln:前缀=”名称空间”

注意,使用xmlns指定的名称空间必须是在schemaLocation中存在的名称空间。

<beans

xmlns:b="http://www.springframework.org/schema/beans"

xmlns:aop="http://www.springframework.org/schema/aop"
xsi:schemaLocation="http://www.springframework.org/schema/beans
http://www.springframework.org/schema/beans/spring-beans-3.0.xsd
http://www.springframework.org/schema/aop
http://www.springframework.org/schema/aop/spring-aop-3.0.xsd">

<b:bean></b:bean>
<aop:scoped-proxy/>

</beans>

2.5 默认名称空间

在一个XML文件中,可以指定一个名称空间没有前缀,那么在当前XML文档中没有前缀的元素就来自默认名称空间。

<beans

xmlns="http://www.springframework.org/schema/beans"

xmlns:aop="http://www.springframework.org/schema/aop"
xsi:schemaLocation="http://www.springframework.org/schema/beans
http://www.springframework.org/schema/beans/spring-beans-3.0.xsd
http://www.springframework.org/schema/aop
http://www.springframework.org/schema/aop/spring-aop-3.0.xsd">

<bean></bean>
<aop:scoped-proxy/>

</beans>

2.6W3C的元素和属性

如果我们的XML文件中需要使用W3C提供的元素和属性,那么可以不在schemaLocation属性中指定XSD文件的位置,但一定要定义名称空间,例如:

<beansxmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"

xsi:schemaLocation="http://www.springframework.org/schema/beans
http://www.springframework.org/schema/beans/spring-beans-3.0.xsd
http://www.springframework.org/schema/aop
http://www.springframework.org/schema/aop/spring-aop-3.0.xsd">

</beans>

上面定义了一个名称空间,前缀为xsi,名称空间为http://www.w3.org/2001/XMLSchema-instance。这个名称空间无需在schemaLocation中不存在这个名称空间。

你可能已经发现了,schemaLocation这个属性其实是w3c定义的属性,与元素一定,属性也需要指定“出处”,xsi:schemaLocation中的xsi就是名称空间前缀。也就是说,上面我们在没有指定xsi名称空间时,就直接使用schemaLocation是错误的。

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读