加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 百科 > 正文

XML入门

发布时间:2020-12-16 00:04:48 所属栏目:百科 来源:网络整理
导读:1.1 引入 HTML: 负责网页的结构 CSS : 负责网页的样式(美观) Javascript : 负责在浏览器端与用户进行交互。 负责静态的网页制作的语言 HTML 语言特点: 1 )由标签组成。 title p hr/ br/ 2 )语法结构松散的 p/p p P 大小写不区分 结束标签和开始标签不

1.1 引入

HTML: 负责网页的结构

CSS: 负责网页的样式(美观)

Javascript: 负责在浏览器端与用户进行交互。

负责静态的网页制作的语言

HTML语言特点:

1)由标签组成。 <title> <p> <hr/> <br/>

2)语法结构松散的 <p></p> <p> <P>

大小写不区分

结束标签和开始标签不一定匹配

<html>

<head>

<title>this is title</title>

</head>

<body>

<p>html标签</p>

<P>html标签</P>

<abc>abc标签</abc> 自定义标签

</body>

</html>

这种自定义标签可以把他们叫做xml标签

1.2 HTMLXML的区别

HTML XML

名称: HyperTextMarkupLanguae(超文本标记语言) Extend Languge(可扩展标签语言)

标签: 标签是w3c组成指定,固定的,约100来个 标签由开发者自己制定的(要按照一定的语法定 义)

作用: 负责网页的结构 1)描述带关系的数据(作为软件的配置文件): 含与被包含的关系

properties文件: key-value

name=eric

password=123456

<user>

<name>eric</name>

<password>123456</password>

</user>

场景:

tomcat

struts Hibernate spring (三大框架)

2)作为数据的载体(存储数据,小型的“数据库”)

2 XML作用

2.1 描述带关系的数据(软件的配置文件

web服务器(PC):

学生管理系统 -> 添加学生功能 -> 添加学生页面 -> name=eric&email=eric@qq.com

前提: 网络(IP地址: oracle255.43.12.54 端口:1521

java代码:使用ip255.43.12.54)地址和端口(1521),连接oracle数据库,保存学生数据。

ip地址端口配置到xml文件:

host.xml

<host>

<ip>255.43.12.55</ip>

<port>1521</port>

</host>

数据库服务器(PC):

主服务器(255.43.12.54):Oracle数据库软件(负载)

副服务器(255.43.12.55):Oracle数据库软件

2.2 数据的载体(小型的“数据库”)

教师管理系统: 姓名 工龄+1 邮箱

发教师数据给财务管理系统:

String teacher = name=张三&email=zhangsan@qq.com&workage=2 字符串

(问题: 1)不好解析 2)不是规范)

teacher.xml

<teacher>

<name>张三</name>

<email>zhangsan@qq.com</email>

<workage>2</workage>

</teacher>

这种一种规范

财务管理系统:

姓名 工龄+1 邮箱

发奖金: 统计奖金。 工龄
发邮件功能:

邮箱 姓名 金额

方案一: 在财务管理系统中维护了一套教师信息。

每年 工龄增加 维护了两个系统的信息。

方案二: 教师信息只在教学管理系统中维护。

3 XML语法

xml文件以xml后缀名结尾。

xml文件需要使用xml解析器去解析。浏览器内置了xml解析器。

3.1 标签

语法: <student></student> 开始标签 标签体内容 结束标签

1<student/> <student></student>空标签。没有标签体内容

2xml标签名称区分大小写。

3xml标签一定要正确配对。

4xml标签名中间不能使用空格

5xml标签名不能以数字开头

6)注意: 在一个xml文档中,有且仅有一个根标签

3.2 属性

语法: <Studentname="eric">student</Student>

注意:

1)属性值必须以引号包含,不能省略,也不能单双引号混用!!!

2)一个标签内可以有多个属性,但不能出现重复的属性名!!!

3.3 注释

语言: <!-- xml注释 -->

练习:

通讯录系统

联系人数据:编号 (唯一的) 姓名 年龄 电话 邮箱 QQ

要求:

contact.xml

1)设计一个xml文件,用于存储联系人数据

2)这个xml文件可以多个联系人。

3.4 文档声明

语法: <?xml version="1.0" encoding="utf-8"?>

version: xml的版本号

encoding: 解析xml文件时查询的码表(解码过程时查询的码表)

注意:

1)如果在ecplise工具中开发xml文件,保存xml文件时自动按照文档声明的encoding来保存文 件。

2)如果用记事本工具修改xml文件,注意保存xml文件按照文档声明的encoding的码表来保存。

3.5 转义字符

xml中内置了一些特殊字符,这些特殊字符不能直接被浏览器原样输出。如果希望把这些特殊字符按照原样输出到浏览器,对这些特殊字符进行转义。转义之后的字符就叫转义字节。

特殊字符 转义字符

< <

> >

" "

& &

空格 &nsbp;

3.6 CDATA

作用: 可以让一些需要进行包含特殊字符的内容统一进行原样输出。

3.7 处理指令

作用: 告诉xml解析如果解析xml文档

案例: <?xml-stylesheet type="text/css" href="1.css"?>告诉xml解析该xml文档引用了哪个css文件

需要提前xml内容可以使用xml-stylesheet指令指令

4 XML解析

4.1 引入

xml文件除了给开发者看,更多的情况使用程序读取xml文件的内容。这叫做xml解析

4.2 XML解析方式(原理不同)

DOM解析

SAX解析

4.3 XML解析工具

DOM解析原理:

1JAXP oracle-Sun公司官方)

2JDOM工具(非官方)

3Dom4J工具(非官方)

三大框架(默认读取xml的工具就是Dom4j

.......

SAX解析原理:

1Sax解析工具(oracle-sun公司官方)

4.4 什么是DOM解析

DOM解析原理:xml解析器一次性把整个xml文档加载进内存,然后在内存中构建一颗Document的对象树,通过Document对象,得到树上的节点对象,通过节点对象访问(操作)到xml文档的内容。

4.5 Dom4j工具

非官方,不在jdk中。

使用步骤:

1)导入dom4j的核心包。 dom4j-1.6.1.jar

2)编写Dom4j读取xml文件代码

publicstaticvoidmain(String[] args) {

try{

//1.创建一个xml解析器对象

SAXReader reader = newSAXReader();

//2.读取文档,返回Document对象

Document doc = reader.read(File("./src/contact.xml"));

System.out.println(doc);

} catch(DocumentException e) {

e.printStackTrace();

thrownewRuntimeException(e);

}

}

4.6 Domj4读取xml文件

节点:

Iterator Element.nodeIterator(); //获取当前标签节点下的所有子节点

标签:

Element Document.getRootElement(); //获取xml文档的根标签

Element ELement.element("标签名") //指定名称的第一个子标签

Iterator<Element> Element.elementIterator("标签名");// 指定名称的所有子标签

List<Element> Element.elements(); //获取所有子标签

属性:

String Element.attributeValue("属性名") //获取指定名称的属性值

Attribute Element.attribute("属性名")//获取指定名称的属性对象

Attribute.getName() //获取属性名称

Attibute.getValue() //获取属性值

List<Attribute> Element.attributes(); //获取所有属性对象

Iterator<Attribute> Element.attibuteIterator(); //获取所有属性对象

文本:

Element.getText(); //获取当前标签的文本

Element.elementText("标签名") //获取当前标签的指定名称的子标签的文本内容

练习:

把上午写的联系人的xml文件内容,使用dom4j完整地读取并打印出来。

总结:

1XML的作用

配置文件(最常见)

作为数据库

2XML语法

3XML解析(DOM解析)

3.1 DOM解析原理

3.2 Dom4j工具(基于DOM解析)

读取:

节点

标签节点

属性节点

文本节点


XML基础

1XML的作用

1.1 作为软件配置文件

1.2 作为小型的“数据库”

2XML语法(由w3c组织规定的)

标签:

标签名不能以数字开头,中间不能有空格,区分大小写。有且仅有一个根标签。

属性:

可有多个属性,但属性值必须用引号(单引号或双引号)包含,但不能省略,也不能单 双混用。

文档声明:

<?xml version="1.0" encoding="utf-8"?>

encoding="utf-8": 打开或解析xml文档时的编码

注意:

保存xml文档时的编码 和 解析xml文档时的编码要保持一致,才能避免中文乱码问题!

3XML解析

程序读取或操作xml文档

两种解析方式: DOM解析 vs SAX解析

DOM解析原理:一次性把xml文档加载成Document树,通过Document对象得到节点对象,通过节点对象访问xml文档内容(标签,属性,文本,注释)。

Dom4j工具(基于DOM解析原理):

读取xml文档:

Document doc = new SAXReader().read("xml文件");

节点:

nodeIterator(); 所有节点

标签:

element("名称") 指定名称的第一个子标签对象

elementIterator("名称"); 指定名称的所有子标签对象

elements(); 所有子标签对象

属性:

attributeValue(“名称”) 指定名称的属性值

attribute("名称") 指定名称的属性对象

getName() 属性名称

getValue() 属性值

atributeIterator() 所有属性对象(Iterator

attributes() 所有属性对象(List

文本:

getText() 得到当前标签的文本

elementText("子标签名称") 得到子标签的文本

今天的目标: Dom4J修改xml + xPath技术 + SAX解析 + XML约束

2 Dom4j修改xml文档

2.1 写出内容到xml文档

XMLWriter writer = new XMLWriter(OutputStream,OutputForamt)

wirter.write(Document);

2.2 修改xml文档的API

增加:

DocumentHelper.createDocument() 增加文档

addElement("名称") 增加标签

addAttribute("名称",“值”) 增加属性

修改:

Attribute.setValue("") 修改属性值

Element.addAtribute("同名的属性名","") 修改同名的属性值

Element.setText("内容") 修改文本内容

删除

Element.detach(); 删除标签

Attribute.detach(); 删除属性

3 xPath技术

3.1 引入

问题:当使用dom4j查询比较深的层次结构的节点(标签,属性,文本),比较麻烦!!!

3.2 xPath作用

主要是用于快速获取所需的节点对象。

3.3 dom4j中如何使用xPath技术

1)导入xPath支持jar包 。 jaxen-1.1-beta-6.jar

2)使用xpath方法

List<Node> selectNodes("xpath表达式"); 查询多个节点对象

Node selectSingleNode("xpath表达式"); 查询一个节点对象

3.4 xPath语法

/ 绝对路径 表示从xml的根位置开始或子元素(一个层次结构)

// 相对路径 表示不分任何层次结构的选择元素。

* 通配符 表示匹配所有元素

[] 条件 表示选择什么条件下的元素

@ 属性 表示选择属性节点

and关系 表示条件的与关系(等价于&&

text() 文本 表示选择文本内容

3.5 案例

用户登录功能:

用户输入用户名和密码 -> 到“数据库”查询是否有对应的用户 ->

有: 则表示登录成功

没有: 则表示登录失败

xml当做数据库

user.xml 用来存储用户的数据

4 SAX解析

4.1回顾DOM解析

DOM解析原理:一次性把xml文档加载进内存,然后在内存中构建Document树。

对内存要求比较要。

缺点: 不适合读取大容量的xml文件,容易导致内存溢出。

SAX解析原理: 加载一点,读取一点,处理一点。对内存要求比较低。

4.2 SAX解析工具

SAX解析工具- Sun公司提供的。内置在jdk中。org.xml.sax.*

核心的API

SAXParser类: 用于读取和解析xml文件对象

parseFilef,DefaultHandlerdh)方法: 解析xml文件

参数一: File:表示 读取的xml文件。

参数二: DefaultHandlerSAX事件处理程序。使用DefaultHandler的子类

例如:{

1.创建SAXParser对象

SAXParserparser=SAXParserFactory.newInstance().newSAXParser();

2.调用parse方法

parser.parse(newFile("./src/contact.xml"),newMyDefaultHandler());

} [一个类继承class 类名(extendsDefaultHandler在调用是创建传进去

DefaultHandler类的API:

void startDocument() : 在读到文档开始时调用

void endDocument() :在读到文档结束时调用

void startElement(String uri,String localName,String qName,Attributes attributes) :读到开始标签时调用

void endElement(String uri,String qName) :读到结束标签时调用

void characters(char[] ch,int start,int length) 读到文本内容时调用

============DOM解析 vs SAX解析 ========

DOM解析

SAX解析

原理: 一次性加载xml文档,不适合大容量的文件读取

原理: 加载一点,读取一点,处理一点。适合大容量文件的读取

DOM解析可以任意进行增删改成

SAX解析只能读取

DOM解析任意读取任何位置的数据,甚至往回读

SAX解析只能从上往下,按顺序读取,不能往回读

DOM解析面向对象的编程方法(NodeElementAttribute,Java开发者编码比较简单。

SAX解析基于事件的编程方法。java开发编码相对复杂。

总结:

1Dom4j修改xml文档

new XMLWrier();

......

2xPath技术: 快速查询xml节点

selectNodes()

selectSinglNode();

xpath表达式语言

3) SAX解析

SAXParser parse

parser()

DefaultHandler类:

startElement();

characters();

endElement();

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读