XML解析三种方式JDom、Sax、Dom4j
对XML进行解析的三种解析方式:JDom、sax、dom4j 一、三种解析的特点: jdom(sun公司)解析:会把xml文档看做一个树,并加载到内存,特别适合做增删改查操作,但当xml文件过大时,容易造成内存溢出 sax(apache)解析:SAX解析允许在读取文档的时候,即对文档进行处理,而不必等整个文档装载完毕后才对文档进行操作。但只能对xml进行读取查询,不能进行增删改操作 dom4j即就是为了解决jdom和sax解析的不足,而产生的另外一种解析方式。即不容易造成内存溢出,又可以对xml文件进行增删改查操作。 二、三种解析大致操作步骤: jdom解析: a、调用DocumentBuilderFactory.newInstance()方法得到创建的DOM解析器的工厂 DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance(); b、调用工厂对象的newDocumentBuilder方法得到dom解析器对象 DocumentBuilder dBuilder = dbf.newDocumentBuilder(); c、调用DOM解析器对象的parse()方法解析XML文档,得到代表整个文档的Document对象,之后就可以对xml文档进行操作啦。 Document document = dBuilder.parse("src/class.xml"); d、具体对XML的操作过程,解析过程中主要用到Node、Element、Document三个主要接口。Element与Document两个接口都实现了Node接口 e、解析完成后需要对xml文档进行更新操作: 创建一个TransformerFactory工厂 TransformerFactory tff = TransformerFactory.newInstance(); 创建执行从 Source 到 Result 的复制的新 Transformer Transformer transformer = tff.newTransformer(); 将XML Source 转换为 Result。xmlSource:要转换的 XML 输入,outputTarget:转换 xmlSource 的 Result transformer.transform(new DOMSource(document),new StreamResult("src/class.xml")); sax解析: a、创建SAXParserFactory工厂: SAXParserFactory spf = SAXParserFactory.newInstance(); b、通过SAXParserFactory工厂获取SAXParser解析器: SAXParser saxParser = spf.newSAXParser(); c、把xml文档解析为sax对象,这里需要借助DefaultHandler类来解析: saxParser.parse("src/class.xml",new XXXDefaultHandler());// 自己新建的XXXDefaultHandler需要继承MyDefaultHandler(SAX2事件处理程序的默 认基类) d、XXXDefaultHandler需要实现DefaultHandler类中的五个基本方法,来实现对XML文档的查询操作(不能对XML进行增删改): 五个基本方法是: startDocument():接收文档开始的通知 startElement(String arg0,String arg1,String arg2,Attributes arg3):接收元素开始的通知(arg0:名称空间 URI,arg1:本地名称,arg2:限定的名 称,arg3:附加到元素的属性) characters(char[] arg0,int arg1,int arg2): 接收元素中字符数据的通知(ch - 字符。start - 字符数组中的开始位置。length - 从字符数组中 使用的字符数) endElement(String arg0,String arg2):接收元素结束的通知(uri - 名称空间 URI,如果元素没有任何名称空间 URI,或者没有 正在执行名称空间处理,则为空字符串。localName - 本地名称(不带前缀),如果没有正在执行名称空间处理,则为空字符串。qName - 限 定的名称(带有前缀),如果限定的名称不可用,则为空字符串) endDocument():接收文档结束的通知 dom4j解析: a、需要引入第三方的jar包:dom4j.jar b、利用SAXReader来读取xml文档 SAXReader saxReader = new SAXReader(); Document document = saxReader.read(new File("src/class.xml")); c、利用dom4j.jar中提供的Document、Element对XML进行增删改查操作 d、因为是第三方jar包,对XML文档进行更新时,中文会出现乱码,故要设置输出样式: OutputFormat outputFormat = OutputFormat.createPrettyPrint(); outputFormat.setEncoding("UTF-8"); e、更新原XML文件 XMLWriter xmlWriter = new XMLWriter(new FileOutputStream(new File("src/class.xml")),outputFormat); xmlWriter.write(document); xmlWriter.close();(编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |