加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 百科 > 正文

XML(二)

发布时间:2020-12-16 06:37:04 所属栏目:百科 来源:网络整理
导读:XML树结构 -------------------------------------------------------------------------------- XML 文档形成了一种树结构,它从 " 根部 " 开始,然后扩展到 " 枝叶 " 。 -------------------------------------------------------------------------------

XML树结构

--------------------------------------------------------------------------------

XML文档形成了一种树结构,它从"根部"开始,然后扩展到"枝叶"

--------------------------------------------------------------------------------

一个XML文档实例

XML文档使用简单的具有自我描述性的语法:

<?xmlversion="1.0"encoding="ISO-8859-1"?>

<note>

<to>Tove</to>

<from>Jani</from>

<heading>Reminder</heading>

<body>Don'tforgetmethisweekend!</body>

</note>

第一行是XML声明。它定义XML的版本(1.0)和所使用的编码(ISO-8859-1=Latin-1/西欧字符集)。

下一行描述文档的根元素(像在说:"本文档是一个便签"):

<note>

接下来4行描述根的4个子元素(to,from,heading以及body):

<to>Tove</to>

<from>Jani</from>

<heading>Reminder</heading>

<body>Don'tforgetmethisweekend!</body>

最后一行定义根元素的结尾:

</note>

您可以假设,从这个实例中,XML文档包含了一张Jani写给Tove的便签。

XML具有出色的自我描述性,您同意吗?

--------------------------------------------------------------------------------

XML文档形成一种树结构

XML文档必须包含根元素。该元素是所有其他元素的父元素。

XML文档中的元素形成了一棵文档树。这棵树从根部开始,并扩展到树的最底端。

所有的元素都可以有子元素:

<root>

<child>

<subchild>.....</subchild>

</child>

</root>

父、子以及同胞等术语用于描述元素之间的关系。父元素拥有子元素。相同层级上的子元素成为同胞(兄弟或姐妹)。

所有的元素都可以有文本内容和属性(类似HTML中)。

--------------------------------------------------------------------------------

实例:

上图表示下面的XML中的一本书:

<bookstore>

<bookcategory="COOKING">

<titlelang="en">EverydayItalian</title>

<author>GiadaDeLaurentiis</author>

<year>2005</year>

<price>30.00</price>

</book>

<bookcategory="CHILDREN">

<titlelang="en">HarryPotter</title>

<author>JK.Rowling</author>

<year>2005</year>

<price>29.99</price>

</book>

<bookcategory="WEB">

<titlelang="en">LearningXML</title>

<author>ErikT.Ray</author>

<year>2003</year>

<price>39.95</price>

</book>

</bookstore>

实例中的根元素是<bookstore>。文档中的所有<book>元素都被包含在<bookstore>中。

<book>元素有4个子元素:<title><author><year><price>

XML语法规则

--------------------------------------------------------------------------------

XML的语法规则很简单,且很有逻辑。这些规则很容易学习,也很容易使用。

--------------------------------------------------------------------------------

所有的XML元素都必须有一个关闭标签

HTML中,某些元素不必有一个关闭标签:

<p>Thisisaparagraph.

<br>

XML中,省略关闭标签是非法的。所有元素都必须有关闭标签:

<p>Thisisaparagraph.</p>

<br/>

注释:从上面的实例中,您也许已经注意到XML声明没有关闭标签。这不是错误。声明不是XML文档本身的一部分,它没有关闭标签。

--------------------------------------------------------------------------------

XML标签对大小写敏感

XML标签对大小写敏感。标签<Letter>与标签<letter>是不同的。

必须使用相同的大小写来编写打开标签和关闭标签:

<Message>Thisisincorrect</message>

<message>Thisiscorrect</message>

注释:打开标签和关闭标签通常被称为开始标签和结束标签。不论您喜欢哪种术语,它们的概念都是相同的。

--------------------------------------------------------------------------------

XML必须正确嵌套

HTML中,常会看到没有正确嵌套的元素:

<b><i>Thistextisboldanditalic</b></i>

XML中,所有元素都必须彼此正确地嵌套:

<b><i>Thistextisboldanditalic</i></b>

在上面的实例中,正确嵌套的意思是:由于<i>元素是在<b>元素内打开的,那么它必须在<b>元素内关闭。

--------------------------------------------------------------------------------

XML文档必须有根元素

XML文档必须有一个元素是所有其他元素的父元素。该元素称为根元素。

<root>

<child>

<subchild>.....</subchild>

</child>

</root>

--------------------------------------------------------------------------------

XML属性值必须加引号

HTML类似,XML元素也可拥有属性(名称/值的对)。

XML中,XML的属性值必须加引号。

请研究下面的两个XML文档。第一个是错误的,第二个是正确的:

<notedate=12/11/2007>

<to>Tove</to>

<from>Jani</from>

</note>

<notedate="12/11/2007">

<to>Tove</to>

<from>Jani</from>

</note>

在第一个文档中的错误是,note元素中的date属性没有加引号。

--------------------------------------------------------------------------------

实体引用

XML中,一些字符拥有特殊的意义。

如果您把字符"<"放在XML元素中,会发生错误,这是因为解析器会把它当作新元素的开始。

这样会产生XML错误:

<message>ifsalary<1000then</message>

为了避免这个错误,请用实体引用来代替"<"字符:

<message>ifsalary<1000then</message>

XML中,有5个预定义的实体引用:

<

<

lessthan

>

>

greaterthan

&

&

ampersand

'

'

apostrophe

"

"

quotationmark

注释:在XML中,只有字符"<""&"确实是非法的。大于号是合法的,但是用实体引用来代替它是一个好习惯。

--------------------------------------------------------------------------------

XML中的注释

XML中编写注释的语法与HTML的语法很相似。

<!--Thisisacomment-->

--------------------------------------------------------------------------------

XML中,空格会被保留

HTML会把多个连续的空格字符裁减(合并)为一个:

HTML:HelloTove

Output:HelloTove

XML中,文档中的空格不会被删减。

--------------------------------------------------------------------------------

XMLLF存储换行

Windows应用程序中,换行通常以一对字符来存储:回车符(CR)和换行符(LF)。

UnixMacOSX中,使用LF来存储新行。

在旧的Mac系统中,使用CR来存储新行。

XMLLF存储换行。

XML元素

--------------------------------------------------------------------------------

XML文档包含XML元素。

--------------------------------------------------------------------------------

什么是XML元素?

XML元素指的是从(且包括)开始标签直到(且包括)结束标签的部分。

一个元素可以包含:

其他元素

文本

属性

或混合以上所有...

<bookstore>

<bookcategory="CHILDREN">

<title>HarryPotter</title>

<author>JK.Rowling</author>

<year>2005</year>

<price>29.99</price>

</book>

<bookcategory="WEB">

<title>LearningXML</title>

<author>ErikT.Ray</author>

<year>2003</year>

<price>39.95</price>

</book>

</bookstore>

在上面的实例中,<bookstore><book>都有元素内容,因为他们包含其他元素。<book>元素也有属性(category="CHILDREN")。<title><author><year><price>有文本内容,因为他们包含文本。

--------------------------------------------------------------------------------

XML命名规则

XML元素必须遵循以下命名规则:

名称可以包含字母、数字以及其他的字符

名称不能以数字或者标点符号开始

名称不能以字母xml(或者XMLXml等等)开始

名称不能包含空格

可使用任何名称,没有保留的字词。

--------------------------------------------------------------------------------

最佳命名习惯

使名称具有描述性。使用下划线的名称也很不错:<first_name><last_name>

名称应简短和简单,比如:<book_title>,而不是:<the_title_of_the_book>

避免"-"字符。如果您按照这样的方式进行命名:"first-name",一些软件会认为您想要从first里边减去name

避免"."字符。如果您按照这样的方式进行命名:"first.name",一些软件会认为"name"是对象"first"的属性。

避免":"字符。冒号会被转换为命名空间来使用(稍后介绍)。

XML文档经常有一个对应的数据库,其中的字段会对应XML文档中的元素。有一个实用的经验,即使用数据库的命名规则来命名XML文档中的元素。

XML中,éòá等非英语字母是完全合法的,不过需要留意,您的软件供应商不支持这些字符时可能出现的问题。

--------------------------------------------------------------------------------

XML元素是可扩展的

XML元素是可扩展,以携带更多的信息。

请看下面的XML实例:

<note>

<to>Tove</to>

<from>Jani</from>

<body>Don'tforgetmethisweekend!</body>

</note>

让我们设想一下,我们创建了一个应用程序,可将<to><from>以及<body>元素从XML文档中提取出来,并产生以下的输出:

MESSAGE

To:Tove

From:Jani

Don'tforgetmethisweekend!

想象一下,XML文档的作者添加的一些额外信息:

<note>

<date>2008-01-10</date>

<to>Tove</to>

<from>Jani</from>

<heading>Reminder</heading>

<body>Don'tforgetmethisweekend!</body>

</note>

那么这个应用程序会中断或崩溃吗?

不会。这个应用程序仍然可以找到XML文档中的<to><from>以及<body>元素,并产生同样的输出。

XML的优势之一,就是可以在不中断应用程序的情况下进行扩展。


XML属性

--------------------------------------------------------------------------------

XML元素具有属性,类似HTML

属性(Attribute)提供有关元素的额外信息。

--------------------------------------------------------------------------------

XML属性

HTML中,属性提供有关元素的额外信息:

<imgsrc="computer.gif">

<ahref="demo.html">

属性通常提供不属于数据组成部分的信息。在下面的实例中,文件类型与数据无关,但是对需要处理这个元素的软件来说却很重要:

<filetype="gif">computer.gif</file>

--------------------------------------------------------------------------------

XML属性值必须加引号

属性值必须被引号包围,不过单引号和双引号均可使用。比如一个人的性别,person元素可以这样写:

<personsex="female">

或者这样也可以:

<personsex='female'>

如果属性值本身包含双引号,您可以使用单引号,就像这个实例:

<gangstername='George"Shotgun"Ziegler'>

或者您可以使用字符实体:

<gangstername="George"Shotgun"Ziegler">

--------------------------------------------------------------------------------

XML元素vs.属性

请看这些实例:

<personsex="female">

<firstname>Anna</firstname>

<lastname>Smith</lastname>

</person>

<person>

<sex>female</sex>

<firstname>Anna</firstname>

<lastname>Smith</lastname>

</person>

在第一个实例中,sex是一个属性。在第二个实例中,sex是一个元素。这两个实例都提供相同的信息。

没有什么规矩可以告诉我们什么时候该使用属性,而什么时候该使用元素。我的经验是在HTML中,属性用起来很便利,但是在XML中,您应该尽量避免使用属性。如果信息感觉起来很像数据,那么请使用元素吧。

--------------------------------------------------------------------------------

我最喜欢的方式

下面的三个XML文档包含完全相同的信息:

第一个实例中使用了date属性:

<notedate="10/01/2008">

<to>Tove</to>

<from>Jani</from>

<heading>Reminder</heading>

<body>Don'tforgetmethisweekend!</body>

</note>

第二个实例中使用了date元素:

<note>

<date>10/01/2008</date>

<to>Tove</to>

<from>Jani</from>

<heading>Reminder</heading>

<body>Don'tforgetmethisweekend!</body>

</note>

第三个实例中使用了扩展的date元素(这是我的最爱):

<note>

<date>

<day>10</day>

<month>01</month>

<year>2008</year>

</date>

<to>Tove</to>

<from>Jani</from>

<heading>Reminder</heading>

<body>Don'tforgetmethisweekend!</body>

</note>

--------------------------------------------------------------------------------

避免XML属性?

因使用属性而引起的一些问题:

属性不能包含多个值(元素可以)

属性不能包含树结构(元素可以)

属性不容易扩展(为未来的变化)

属性难以阅读和维护。请尽量使用元素来描述数据。而仅仅使用属性来提供与数据无关的信息。

不要做这样的蠢事(这不是XML应该被使用的方式):

<noteday="10"month="01"year="2008"

to="Tove"from="Jani"heading="Reminder"

body="Don'tforgetmethisweekend!">

</note>

--------------------------------------------------------------------------------

针对元数据的XML属性

有时候会向元素分配ID引用。这些ID索引可用于标识XML元素,它起作用的方式与HTMLid属性是一样的。这个实例向我们演示了这种情况:

<messages>

<noteid="501">

<to>Tove</to>

<from>Jani</from>

<heading>Reminder</heading>

<body>Don'tforgetmethisweekend!</body>

</note>

<noteid="502">

<to>Jani</to>

<from>Tove</from>

<heading>Re:Reminder</heading>

<body>Iwillnot</body>

</note>

</messages>

上面的id属性仅仅是一个标识符,用于标识不同的便签。它并不是标签数据的组成部分。

在此我们极力向您传递的理念是:元数据(有关数据的数据)应当存储为属性,而数据本身应当存储为元素。

XML验证

--------------------------------------------------------------------------------

拥有正确语法的XML被称为"形式良好"XML

通过DTD验证的XML"合法"XML

--------------------------------------------------------------------------------

形式良好的XML文档

"形式良好"XML文档拥有正确的语法。

在前面的章节描述的语法规则:

XML文档必须有一个根元素

XML元素都必须有一个关闭标签

XML标签对大小写敏感

XML元素必须被正确的嵌套

XML属性值必须加引号

<?xmlversion="1.0"encoding="ISO-8859-1"?>

<note>

<to>Tove</to>

<from>Jani</from>

<heading>Reminder</heading>

<body>Don'tforgetmethisweekend!</body>

</note>

--------------------------------------------------------------------------------

验证XML文档

合法的XML文档是"形式良好"XML文档,这也符合文档类型定义(DTD)的规则:

<?xmlversion="1.0"encoding="ISO-8859-1"?>

<!DOCTYPEnoteSYSTEM"Note.dtd">

<note>

<to>Tove</to>

<from>Jani</from>

<heading>Reminder</heading>

<body>Don'tforgetmethisweekend!</body>

</note>

在上面的实例中,DOCTYPE声明是对外部DTD文件的引用。下面的段落展示了这个文件的内容。

--------------------------------------------------------------------------------

XMLDTD

DTD的目的是定义XML文档的结构。它使用一系列合法的元素来定义文档结构:

<!DOCTYPEnote

[

<!ELEMENTnote(to,heading,body)>

<!ELEMENTto(#PCDATA)>

<!ELEMENTfrom(#PCDATA)>

<!ELEMENTheading(#PCDATA)>

<!ELEMENTbody(#PCDATA)>

]>

--------------------------------------------------------------------------------

XMLSchema

W3C支持一种基于XMLDTD代替者,它名为XMLSchema

<xs:elementname="note">

<xs:complexType>

<xs:sequence>

<xs:elementname="to"type="xs:string"/>

<xs:elementname="from"type="xs:string"/>

<xs:elementname="heading"type="xs:string"/>

<xs:elementname="body"type="xs:string"/>

</xs:sequence>

</xs:complexType>

</xs:element>

--------------------------------------------------------------------------------

使用CSS显示XML

--------------------------------------------------------------------------------

通过使用CSSCascadingStyleSheets层叠样式表),您可以添加显示信息到XML文档中。

--------------------------------------------------------------------------------

使用CSS显示您的XML

使用CSS来格式化XML文档是有可能的。

下面的实例就是关于如何使用CSS样式表来格式化XML文档:

下面是XML文件的一小部分。第二行把XML文件链接到CSS文件:

<?xmlversion="1.0"encoding="ISO-8859-1"?>

<?xml-stylesheettype="text/css"href="cd_catalog.css"?>

<CATALOG>

<CD>

<TITLE>EmpireBurlesque</TITLE>

<ARTIST>BobDylan</ARTIST>

<COUNTRY>USA</COUNTRY>

<COMPANY>Columbia</COMPANY>

<PRICE>10.90</PRICE>

<YEAR>1985</YEAR>

</CD>

<CD>

<TITLE>Hideyourheart</TITLE>

<ARTIST>BonnieTyler</ARTIST>

<COUNTRY>UK</COUNTRY>

<COMPANY>CBSRecords</COMPANY>

<PRICE>9.90</PRICE>

<YEAR>1988</YEAR>

</CD>

.

.

.

</CATALOG>

使用CSS格式化XML不是常用的方法。

使用XSLT显示XML

--------------------------------------------------------------------------------

通过使用XSLT,您可以把XML文档转换成HTML格式。

--------------------------------------------------------------------------------

使用XSLT显示XML

XSLT是首选的XML样式表语言。

XSLTeXtensibleStylesheetLanguageTransformations)远比CSS更加完善。

XSLT是在浏览器显示XML文件之前,先把它转换为HTML

使用XSLT显示XML

--------------------------------------------------------------------------------

在服务器上通过XSLT转换XML

在上面的实例中,当浏览器读取XML文件时,XSLT转换是由浏览器完成的。

在使用XSLT来转换XML时,不同的浏览器可能会产生不同结果。为了减少这种问题,可以在服务器上进行XSLT转换。

如果您想要学习有关XSLT的知识,请在我们的首页查找XSLT教程。





(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读