1. DOM(Document Object Model)
此 方法主要由W3C提供,它将xml文件全部读入内存中,然后将各个元素组成一棵数据树,以便快速的访问各个节点 。 因此非常消耗系统性能 ,对比较大的文档不适宜采用DOM方法来解析。 DOM API 直接沿袭了 XML 规范。每个结点都可以扩展的基于 Node 的接口,就多态性的观点来讲,它是优秀的,但是在 Java 语言中的应用不方便,并且可读性不强。 实例:
- importjavax.xml.parsers.*;
-
- importorg.w3c.dom.*;
- //XML的DOM实现
- importorg.apache.crimson.tree.XmlDocument;
- //写XML文件要用到
- DocumentBuilderFactoryfactory=DocumentBuilderFactory.newInstance();
- //允许名字空间
- factory.setNamespaceAware(true);
- //允许验证
- factory.setValidating(//获得DocumentBuilder的一个实例
- try{
- DocumentBuilderbuilder=factory.newDocumentBuilder();
- }catch(ParserConfigurationExceptionpce){
- System.err.println(pce);
- //出异常时输出异常信息,然后退出,下同
- System.exit(1);
- }
- //解析文档,并获得一个Document实例。
- Documentdoc=builder.parse(fileURI);
- catch(DOMExceptiondom){
- System.err.println(dom.getMessage());
- catch(IOExceptionioe){
- System.err.println(ioe);
- //获得根节点StuInfo
- ElementelmtStuInfo=doc.getDocumentElement();
- //得到所有student节点
- NodeListnlStudent=elmtStuInfo.getElementsByTagNameNS(
- strNamespace,"student");
- for(……){
- //当前student节点元素
- ElementelmtStudent=(Element)nlStudent.item(i);
- NodeListnlCurrent=elmtStudent.getElementsByTagNameNS(
- "name");
- }
对于读取得方法其实是很简单的,写入xml文件也是一样不复杂。
J
ava代码 DocumentBuilderbuilder=null;
builder=factory.newDocumentBuilder();
Documentdoc= doc=builder.newDocument();
//下面是建立XML文档内容的过程,
//先建立根元素"学生花名册"
Elementroot=doc.createElement("学生花名册");
//根元素添加上文档
doc.appendChild(root);
//建立"学生"元素,添加到根元素
Elementstudent=doc.createElement("学生");
student.setAttribute("性别",studentBean.getSex());
root.appendChild(student);
//建立"姓名"元素,添加到学生下面,下同
Elementname=doc.createElement("姓名");
student.appendChild(name);
TexttName=doc.createTextNode(studentBean.getName());
name.appendChild(tName);
Elementage=doc.createElement("年龄");
student.appendChild(age);
TexttAge=doc.createTextNode(String.valueOf(studentBean.getAge()));
age.appendChild(tAge);
2.SAX (Simple API for XML)
此方法主要由XML-DEV 邮件列表的成员开发的,SAX是基于事件的方法,它很类似于标签库的处理机制,在标签开始、结束以及错误发生等等地方调用相应的接口实现方法,不是全部文 档都读入内存。 SAX具有优异的性能和利用更少的存储空间特点。SAX 的设计只考虑了功能的强大性,却没有考虑程序员使用起来是否方便。
使用必须扩展ContentHandler、ErrorHandler、DTDHandler等,但是必须扩展ContentHandler(或者DefaultHandler )。
importorg.xml.sax.*;
publicclassMyContentHandlerimplementsContentHandler{
……
/**
*当其他某一个调用事件发生时,先调用此方法来在文档中定位。
*@paramlocator
*/
voidsetDocumentLocator(Locatorlocator){
*在解析整个文档开始时调用
*@throwsSAXException
voidstartDocument()throwsSAXException{
System.out.println("**Studentinformationstart**");
*在解析整个文档结束时调用
voidendDocument() System.out.println("****Studentinformationend****");
*在解析名字空间开始时调用
*@paramprefix
*@paramuri
voidstartPrefixMapping(Stringprefix
,Stringuri)*在解析名字空间结束时调用
voidendPrefixMapping(Stringprefix)*在解析元素开始时调用
*@paramnamespaceURI
*@paramlocalName
*@paramqName
*@paramatts
voidstartElement(StringnamespaceURI,StringlocalName
/**在解析元素结束时调用
*@paramlocalName本地名,如student
*@paramqName原始名,如LIT:student
*@throwsSAXException*/
voidendElement(StringnamespaceURI,StringlocalName,StringqName)if(localName.equals(“student”)){
System.out.println(localName+":"+currentData);
取得元素数据的方法——characters
取得元素数据中的空白的方法——ignorableWhitespace 在解析到处理指令时调用的方法——processingInstruction 当未验证解析器忽略实体时调用的方法——skippedEntity 运行时,只需要使用下列代码:
MySAXParsermySAXParser=newMySAXParser();
mySAXParser.parserXMLFile("SutInfo.xml");
3.JDOM
JDOM的处理方式有些类似于DOM,但它主要是用SAX实现的 。JDOM用Java的数据类型来定义操作数据树的各个节点 。JDOM的性能也很优越。
Java代码
importorg.jdom.*;
- importorg.jdom.input.*;
- importorg.jdom.output.*;
- SAXBuilderbuilder=newSAXBuilder(false);
- //得到Document
- Documentdoc=builder.build(fileURI);
- //名字空间
- Namespacens=Namespace.getNamespace("LIT","http://www.lit.edu.cn/student/");
- //取得所有LIT:student节点的集合
- ListlstStudents=elmtStuInfo.getChildren("student",ns);
- for(…){
- ElementelmtStudent=(Element)lstStudents.get(i);
- elmtStudent.getChildTextTrim("name",0); padding:0px; margin:0px; width:auto; border:0px">//修改
- elmtLesson.getChild("lessonScore",ns).setText("100");
- //删除
- elmtStuInfo.removeChild("master",0); padding:0px; margin:0px; width:auto; border:0px">//添加
- elmtStuInfo.addContent(newElement("master",ns).addContent(newEntity("masterName")));
- //输出文档
- //第一个参数是缩进字符串,这里是4个空格。
- //第二个参数是true,表示需要换行。
- XMLOutputterprintDoc=newXMLOutputter("", printDoc.output(doc,85); font-weight:bold">newFileOutputStream("StuInfo.xml"));
4.JAXB (Java And XML Binding)
JAXB 是以SUN为主的一些公司公布的。JAXB将schema(或者DTD)映射为java对象(.java文件),然后使用这些java对象来解析xml文件。需要使用之前生成java文件,因而要有固定的schema,无法处理动态的xml文件。
首先使用xjc命令,生成java文件 xjc [-options ...]
(生成的文件较多)
JAXBContextjc=JAXBContext.newInstance(“packageName");
- Unmarshallerunmarshaller=jc.createUnmarshaller();
- Collectioncollection=(Collection)unmarshaller.unmarshal(newFile("books.xml"));
- CollectionType.BooksTypebooksType=collection.getBooks();
- ListbookList=booksType.getBook();
- for(…){
- test.jaxb.BookTypebook=(test.jaxb.BookType)bookList.get(i);
- System.out.println("BookName:"+book.getName().trim());
- System.out.println("BookISBN:"+book.getISBN());
- }
补充另一种方法:(支持XPATH引擎)
据悉dom4j在xml解析方面是性能最好的,hibernate等框架都使用它作为解析的工具。
要使用dom4j读写XML文档,需要先下载dom4j包,dom4j官方网站在http://www.dom4j.org/
目前最新dom4j包下载地址:http://nchc.dl.sourceforge.net/sourceforge/dom4j/dom4j-1.6.1.zip
解开后有两个包,仅操作XML文档的话把dom4j-1.6.1.jar加入工程就可以了,如果需要使用XPath的话还需要加入包jaxen-1.1-beta-7.jar
转自:http://www.iteye.com/topic/668280
http://www.iteye.com/topic/612837 (编辑:李大同)
【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!
|