XML入门
1.1 引入HTML: 负责网页的结构 CSS: 负责网页的样式(美观) Javascript: 负责在浏览器端与用户进行交互。 负责静态的网页制作的语言 HTML语言特点: 1)由标签组成。 <title> <p> <hr/> <br/> 2)语法结构松散的 <p></p> <p> <P> 大小写不区分 结束标签和开始标签不一定匹配
这种自定义标签可以把他们叫做xml标签。 1.2 HTML和XML的区别HTML XML 名称: HyperTextMarkupLanguae(超文本标记语言) Extend Languge(可扩展标签语言) 标签: 标签是w3c组成指定,固定的,约100来个 标签由开发者自己制定的(要按照一定的语法定 义) 作用: 负责网页的结构 1)描述带关系的数据(作为软件的配置文件): 包 含与被包含的关系 properties文件: key-value name=eric password=123456 <user> <name>eric</name> <password>123456</password> </user> 场景: tomcat struts Hibernate spring (三大框架) 2)作为数据的载体(存储数据,小型的“数据库”) 2 XML作用2.1 描述带关系的数据(软件的配置文件)web服务器(PC): 学生管理系统 -> 添加学生功能 -> 添加学生页面 -> name=eric&email=eric@qq.com 前提: 网络(IP地址: oracle:255.43.12.54 端口:1521 ) java代码:使用ip(255.43.12.54)地址和端口(1521),连接oracle数据库,保存学生数据。 把ip地址端口配置到xml文件: host.xml <host> <ip>255.43.12.55</ip> <port>1521</port> </host> 数据库服务器(PC): 主服务器(255.43.12.54):Oracle数据库软件(负载) 副服务器(255.43.12.55):Oracle数据库软件 2.2 数据的载体(小型的“数据库”)教师管理系统: 姓名 工龄+1 邮箱 发教师数据给财务管理系统: String teacher = name=张三&email=zhangsan@qq.com&workage=2 字符串 (问题: 1)不好解析 2)不是规范) teacher.xml <teacher> <name>张三</name> <email>zhangsan@qq.com</email> <workage>2</workage> </teacher> 这种一种规范
财务管理系统: 姓名 工龄+1 邮箱 发奖金: 统计奖金。 工龄 邮箱 姓名 金额 方案一: 在财务管理系统中维护了一套教师信息。 每年 : 工龄增加 维护了两个系统的信息。 方案二: 教师信息只在教学管理系统中维护。 3 XML语法xml文件以xml后缀名结尾。 xml文件需要使用xml解析器去解析。浏览器内置了xml解析器。 3.1 标签语法: <student></student> 开始标签 标签体内容 结束标签 1)<student/>或 <student></student>空标签。没有标签体内容 2)xml标签名称区分大小写。 3)xml标签一定要正确配对。 4)xml标签名中间不能使用空格 5)xml标签名不能以数字开头 6)注意: 在一个xml文档中,有且仅有一个根标签 3.2 属性语法: <Studentname="eric">student</Student> 注意: 1)属性值必须以引号包含,不能省略,也不能单双引号混用!!! 2)一个标签内可以有多个属性,但不能出现重复的属性名!!! 3.3 注释语言: <!-- xml注释 --> 练习: 通讯录系统 联系人数据:编号 (唯一的) 姓名 年龄 电话 邮箱 QQ 要求: contact.xml 1)设计一个xml文件,用于存储联系人数据 2)这个xml文件可以多个联系人。 3.4 文档声明语法: <?xml version="1.0" encoding="utf-8"?> version: xml的版本号 encoding: 解析xml文件时查询的码表(解码过程时查询的码表) 注意: 1)如果在ecplise工具中开发xml文件,保存xml文件时自动按照文档声明的encoding来保存文 件。 2)如果用记事本工具修改xml文件,注意保存xml文件按照文档声明的encoding的码表来保存。 3.5 转义字符在xml中内置了一些特殊字符,这些特殊字符不能直接被浏览器原样输出。如果希望把这些特殊字符按照原样输出到浏览器,对这些特殊字符进行转义。转义之后的字符就叫转义字节。 特殊字符 转义字符 < < > > " " & & 空格 &nsbp; 3.6 CDATA块作用: 可以让一些需要进行包含特殊字符的内容统一进行原样输出。 3.7 处理指令作用: 告诉xml解析如果解析xml文档 案例: <?xml-stylesheet type="text/css" href="1.css"?>告诉xml解析该xml文档引用了哪个css文件 需要提前xml内容可以使用xml-stylesheet指令指令 4 XML解析4.1 引入xml文件除了给开发者看,更多的情况使用程序读取xml文件的内容。这叫做xml解析 4.2 XML解析方式(原理不同)DOM解析 SAX解析 4.3 XML解析工具DOM解析原理: 1)JAXP (oracle-Sun公司官方) 2)JDOM工具(非官方) 3)Dom4J工具(非官方) 三大框架(默认读取xml的工具就是Dom4j) .......
SAX解析原理: 1)Sax解析工具(oracle-sun公司官方) 4.4 什么是DOM解析DOM解析原理:xml解析器一次性把整个xml文档加载进内存,然后在内存中构建一颗Document的对象树,通过Document对象,得到树上的节点对象,通过节点对象访问(操作)到xml文档的内容。 4.5 Dom4j工具非官方,不在jdk中。 使用步骤: 1)导入dom4j的核心包。 dom4j-1.6.1.jar 2)编写Dom4j读取xml文件代码
4.6 Domj4读取xml文件节点: Iterator Element.nodeIterator(); //获取当前标签节点下的所有子节点 标签: Element Document.getRootElement(); //获取xml文档的根标签 Element ELement.element("标签名") //指定名称的第一个子标签 Iterator<Element> Element.elementIterator("标签名");// 指定名称的所有子标签 List<Element> Element.elements(); //获取所有子标签 属性: String Element.attributeValue("属性名") //获取指定名称的属性值 Attribute Element.attribute("属性名");//获取指定名称的属性对象 Attribute.getName() //获取属性名称 Attibute.getValue() //获取属性值 List<Attribute> Element.attributes(); //获取所有属性对象 Iterator<Attribute> Element.attibuteIterator(); //获取所有属性对象 文本: Element.getText(); //获取当前标签的文本 Element.elementText("标签名") //获取当前标签的指定名称的子标签的文本内容 练习: 把上午写的联系人的xml文件内容,使用dom4j完整地读取并打印出来。 总结: 1)XML的作用 配置文件(最常见) 作为数据库 2)XML语法 3)XML解析(DOM解析) 3.1 DOM解析原理 3.2 Dom4j工具(基于DOM解析) 读取: 节点 标签节点 属性节点 文本节点
XML基础 1)XML的作用 1.1 作为软件配置文件 1.2 作为小型的“数据库” 2)XML语法(由w3c组织规定的) 标签: 标签名不能以数字开头,中间不能有空格,区分大小写。有且仅有一个根标签。 属性: 可有多个属性,但属性值必须用引号(单引号或双引号)包含,但不能省略,也不能单 双混用。 文档声明: <?xml version="1.0" encoding="utf-8"?> encoding="utf-8": 打开或解析xml文档时的编码 注意: 保存xml文档时的编码 和 解析xml文档时的编码要保持一致,才能避免中文乱码问题! 3)XML解析 程序读取或操作xml文档 两种解析方式: DOM解析 vs SAX解析 DOM解析原理:一次性把xml文档加载成Document树,通过Document对象得到节点对象,通过节点对象访问xml文档内容(标签,属性,文本,注释)。 Dom4j工具(基于DOM解析原理): 读取xml文档: Document doc = new SAXReader().read("xml文件"); 节点: nodeIterator(); 所有节点 标签: element("名称") 指定名称的第一个子标签对象 elementIterator("名称"); 指定名称的所有子标签对象 elements(); 所有子标签对象 属性: attributeValue(“名称”) 指定名称的属性值 attribute("名称") 指定名称的属性对象 getName() 属性名称 getValue() 属性值 atributeIterator() 所有属性对象(Iterator) attributes() 所有属性对象(List) 文本: getText() 得到当前标签的文本 elementText("子标签名称") 得到子标签的文本 今天的目标: Dom4J修改xml + xPath技术 + SAX解析 + XML约束 2 Dom4j修改xml文档2.1 写出内容到xml文档XMLWriter writer = new XMLWriter(OutputStream,OutputForamt) wirter.write(Document); 2.2 修改xml文档的API增加: DocumentHelper.createDocument() 增加文档 addElement("名称") 增加标签 addAttribute("名称",“值”) 增加属性 修改: Attribute.setValue("值") 修改属性值 Element.addAtribute("同名的属性名","值") 修改同名的属性值 Element.setText("内容") 修改文本内容 删除 Element.detach(); 删除标签 Attribute.detach(); 删除属性 3 xPath技术3.1 引入问题:当使用dom4j查询比较深的层次结构的节点(标签,属性,文本),比较麻烦!!! 3.2 xPath作用主要是用于快速获取所需的节点对象。 3.3 在dom4j中如何使用xPath技术1)导入xPath支持jar包 。 jaxen-1.1-beta-6.jar 2)使用xpath方法 List<Node> selectNodes("xpath表达式"); 查询多个节点对象 Node selectSingleNode("xpath表达式"); 查询一个节点对象 3.4 xPath语法/ 绝对路径 表示从xml的根位置开始或子元素(一个层次结构) // 相对路径 表示不分任何层次结构的选择元素。 * 通配符 表示匹配所有元素 [] 条件 表示选择什么条件下的元素 @ 属性 表示选择属性节点 and关系 表示条件的与关系(等价于&&) text() 文本 表示选择文本内容 3.5 案例用户登录功能: 用户输入用户名和密码 -> 到“数据库”查询是否有对应的用户 -> 有: 则表示登录成功 没有: 则表示登录失败 用xml当做数据库 user.xml 用来存储用户的数据 4 SAX解析4.1回顾DOM解析DOM解析原理:一次性把xml文档加载进内存,然后在内存中构建Document树。 对内存要求比较要。 缺点: 不适合读取大容量的xml文件,容易导致内存溢出。 SAX解析原理: 加载一点,读取一点,处理一点。对内存要求比较低。 4.2 SAX解析工具SAX解析工具- Sun公司提供的。内置在jdk中。org.xml.sax.* 核心的API: SAXParser类: 用于读取和解析xml文件对象 parse(Filef,DefaultHandlerdh)方法: 解析xml文件 参数一: File:表示 读取的xml文件。 参数二: DefaultHandler: SAX事件处理程序。使用DefaultHandler的子类 例如:{ 1.创建SAXParser对象 SAXParserparser=SAXParserFactory.newInstance().newSAXParser(); 2.调用parse方法 parser.parse(newFile("./src/contact.xml"),newMyDefaultHandler()); } [一个类继承class 类名(extendsDefaultHandler)在调用是创建传进去 DefaultHandler类的API: void startDocument() : 在读到文档开始时调用 void endDocument() :在读到文档结束时调用 void startElement(String uri,String localName,String qName,Attributes attributes) :读到开始标签时调用 void endElement(String uri,String qName) :读到结束标签时调用 void characters(char[] ch,int start,int length) : 读到文本内容时调用 ============DOM解析 vs SAX解析 ========
总结: 1)Dom4j修改xml文档 new XMLWrier(); ...... 2)xPath技术: 快速查询xml节点 selectNodes() selectSinglNode(); xpath表达式语言 3) SAX解析 SAXParser parse parser() DefaultHandler类: startElement(); characters(); endElement(); (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |