加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 百科 > 正文

XML、DTD和Schema

发布时间:2020-12-16 02:10:02 所属栏目:百科 来源:网络整理
导读:定义:XML是一种数据传输和存储格式,用标签保存数据内容,利用标签嵌套关系保存数据之间关系 应用场景:不同平台间数据传输、程序配置文件 存在形式:XML文件、也存在内存或网络中,不要把XML狭隘理解为XML文件 校验:浏览器内置Html和XML解析器,可以校验x

定义:XML是一种数据传输和存储格式,用标签保存数据内容,利用标签嵌套关系保存数据之间关系
应用场景:不同平台间数据传输、程序配置文件
存在形式:XML文件、也存在内存或网络中,不要把XML狭隘理解为XML文件
校验:浏览器内置Html和XML解析器,可以校验xml是否正确

一、XML语法

1、声明或处理指令PI(processing instruction),指定解析器如何解析显示XML文档
    ①声明前不能有任何内容(如注释)
        <?xml version="1.0" encoding="utf-8" standalone="yes"?>  
        version必须存在,当前xml所遵循规范版本1.0     
        encoding指定xml解析编码,必须和xml文件保存编码一致,默认值iso8859-1(欧美拉丁字母符号,没有中文)   
        standalone指明xml是否独立,默认值yes表明不依赖其他文档,no表明依赖其他文档(很多解析器都会忽略此属性)  

    ②处理指令PI
        <?xml-stylesheet type="text/css" href="xxx.css"?>为XML指定样式css显示

2、元素(xml标签)
    只能包含一个根标签   
    一个元素分为开始和结束标签<a>xxx</a>,其间有文本内容(标签体)  
    一个元素不含任何内容为自闭标签<a/>  
    区分大小写如<A><a>是不同标记  
    命名不能以数字、标点符号、"_"、"xml"开头,不能包含空格、冒号  

3、一个元素可以有多个属性,属性值用单引号或双引号<a size="xxx" color="xxx"/>,属性名遵循元素命名规则

4、<!-- 注释内容 -->,除了声明前外可在任意位置、不能嵌套注释  

5、转义字符/CDATA,可以使解析器将转义内容当作普通文本来处理
    ①转义字符  
        &: &amp;  
        <: &lt; >: &gt;  
        ": &quot;  
        ': &apos;
    ②<![CDATA[内容]]>
        被括起来的内容,会被浏览器当作普通文本来处理

    区别:  
        CDATA可以成段的进行转义,而转义字符一次只能转义一个字符  
        CDATA可以保存原始数据,只通知解析器按普通文本去处理  
        转义字符改变了原始数据,用其他字符替代

二、XML约束

1、DTD是XML约束文件(.dtd),约束xml写法,并对xml校验

①外部引入,在外部文件中写DTD,必须用utf-8编码保存
    <!DOCTYPE 根元素名称 SYSTEM 文件位置>
        SYSTEM表明dtd在当前文件系统中,后面文件位置是当前硬盘中的位置     
    <!DOCTYPE 根元素名称 PUBLIC "DTD名称" "DTD文件URL">
        PUBLIC表明dtd在网络公共位置中,后面指明dtd名字和所在网络URL地址

②内部引入,在xml中直接写<!DOCTYPE 根元素名称 [dtd约束的内容]>

③约束元素 <!ELEMENT 元素名称 元素约束>  
    元素约束:
        ANY表示包含任意子元素
        EMPTY表示不含子元素
        ()表示子元素,表示子元素必须按顺序并列出现
        |表示子元素出现其中之一
        #PCDATA表示包含标签体
        +表示一次或多次
        *表示0次或多次
        ?表示0次或一次
        组合:<!ELEMENT 元素名称 ((TITLE*,AUTHOR?,EMAIL)* | COMMENT)>

④约束属性 <!ATTLIST 元素名 属性名 属性类型 属性约束>  
    属性类型:
        CDATA表明普通字符串
        ENUMERATED表明取指定枚举列表值
        ID表明属性值在文档中唯一,只能以字母或下划线开头
    属性约束:
        #REQUIRED表明当前属性必须存在
        #IMPLIED表明当前属性可选
        #FIXED表明当前属性具有固定值
        '默认值'表明当前属性具有默认值

⑤实体ENTITY,对一段重复使用的内容引用、复用
    引用实体,在xml中引用的实体
        定义实体:<!ENTITY 实体名称 “实体内容” >
        使用实体:&实体名称;     
    参数实体,在dtd中引用的实体
        定义实体:<!ENTITY %实体名称 "实体内容">
        使用实体:%实体名称;

实例:
<?xml version = "1.0" encoding="utf-8" ?>
<!DOCTYPE 联系人列表[ <!ELEMENT 联系人列表 ANY> <!ELEMENT 联系人 (姓名,EMAIL)> <!ELEMENT 姓名 (#PCDATA)> <!ELEMENT EMAIL (#PCDATA)> <!ATTLIST 联系人 编号 ID #REQUIRED> ]>
<联系人列表>
    <联系人 编号="a1">
        <姓名>张三</姓名>
        <EMAIL>zhang@it315.org</EMAIL>
    </联系人>
    <联系人 编号="a2">
        <姓名>李四</姓名>
        <EMAIL>li@it315.org</EMAIL>
    </联系人>
</联系人列表>

2、Schema也是xml约束文件(.xsd),目的是为了克服DTD缺陷

1)Schema本身符合xml语法,方便解析
2)对名称空间支持有非常好
3)比DTD更多数据类型,并且自定义数据类型
4)语义约束更精确,强于DTD
5)比DTD复杂多,学习成本高

Schema文档必须有一个根结点(称为Schema)  
名称空间xmlns:全世界唯一标识某个资源(通常是公司域名),仅是名称,不是真实的资源地址

实例: 
XSD文件(book.xsd)
<?xml version="1.0" encoding="UTF-8" ?> 
<xs:schema xmlns:xs="http://www.w3.org/2001/XMLSchema" targetNamespace="www.xxx.com" elementFormDefault="qualified">
    <xs:element name='书架' >
        <xs:complexType>
            <xs:sequence maxOccurs='unbounded' >
                <xs:element name='书' >
                    <xs:complexType>
                        <xs:sequence>
                            <xs:element name='书名' type='xs:string' />
                            <xs:element name='作者' type='xs:string' />
                            <xs:element name='售价' type='xs:string' />
                        </xs:sequence>
                    </xs:complexType>
                </xs:element>
            </xs:sequence>
        </xs:complexType>
    </xs:element>
</xs:schema>

XML文件(.xml)
xmlns:w3指定名称空间(http://www.w3.org/2001/XMLSchema-instance)别名为w3
w3:schemaLocation指定名称空间(www.xxx.com)来源于book.xsd文件(可以是网络地址)
xmlns:my指定名称空间(www.xxx.com)别名为my
<my:书架 xmlns:w3="http://www.w3.org/2001/XMLSchema-instance" w3:schemaLocation="www.xxx.com book.xsd" xmlns:my="www.xxx.com">
    <my:书>
        <my:书名>JavaScript网页开发</my:书名>
        <my:作者>张孝祥</my:作者>
        <my:售价>28.00元</my:售价>
    </my:书>
</my:书架>

XML文件(.xml)
xmlns="www.xxx.com"可以忽略my 没有前缀默认使用这个空间
<书架 xmlns:w3="http://www.w3.org/2001/XMLSchema-instance" w3:schemaLocation="www.xxx.com book.xsd" xmlns="www.xxx.com">
    <>
        <书名>JavaScript网页开发</书名>
        <作者>张孝祥</作者>
        <售价>28.00元</售价>
    </>
</书架>

GitHub博客:http://lioil.win/2017/01/11/Xml-DTD-Schema.html
Coding博客:http://c.lioil.win/2017/01/11/Xml-DTD-Schema.html

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读