加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 编程开发 > Java > 正文

java – 如何在读取文件时忽略空格以生成XML DOM

发布时间:2020-12-14 23:20:57 所属栏目:Java 来源:网络整理
导读:我正在尝试读取一个文件来生成一个DOM文档,但该文件有空格和换行符,我试图忽略它们,但我不能: DocumentBuilderFactory docfactory=DocumentBuilderFactory.newInstance();docfactory.setIgnoringElementContentWhitespace(true); 我在Javadoc中看到setIgnor
我正在尝试读取一个文件来生成一个DOM文档,但该文件有空格和换行符,我试图忽略它们,但我不能:
DocumentBuilderFactory docfactory=DocumentBuilderFactory.newInstance();
docfactory.setIgnoringElementContentWhitespace(true);

我在Javadoc中看到setIgnoringElementContentWhitespace方法仅在启用验证标志时才运行,但我没有文档的DTD或XML Schema.

我能做什么?

更新

我不喜欢介绍mySelf的想法< !ELEMENT ...声明,我试过了
Tomalak指出的forum中提出的解决方案,但它不起作用,我在linux环境中使用了java 1.6.我想如果不再提议,我会做一些方法来忽略空白文本节点

解决方法

‘IgnoringElementContentWhitespace’不是关于删除所有纯空白文本节点,而是仅删除其父项在模式中描述为具有ELEMENT内容的空白节点 – 也就是说,它们仅包含其他元素而从不包含文本.

如果您没有使用架构(DTD或XSD),则元素内容默认为MIXED,因此此参数将永远不会产生任何影响. (除非解析器提供非标准的DOM扩展来将所有未知元素视为包含ELEMENT内容,据我所知,Java可用的内容不会.)

您可以在进入解析器的途中破解文档以包含架构信息,例如通过向<中添加内部子集. !DOCTYPE ... [...]>声明包含< !ELEMENT ...>声明,然后使用IgnoringElementContentWhitespace参数.

或者,可能更容易,您可以在后处理中或在使用LSParserFilter时删除空白节点.

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读