加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 编程开发 > Java > 正文

java – 为什么org.apache.xerces.parsers.SAXParser不会跳过utf

发布时间:2020-12-14 06:05:55 所属栏目:Java 来源:网络整理
导读:我有一个带utf8编码的xml. 此文件包含BOM作为文件的开头. 所以在解析过程中我遇到了org.xml.sax.SAXParseException:prolog中不允许使用内容. 我无法从文件中删除这3个字节. 我无法将文件加载到内存中并在此处删除它们(文件很大). 因此,出于性能原因,我正在
我有一个带utf8编码的xml.
此文件包含BOM作为文件的开头.
所以在解析过程中我遇到了org.xml.sax.SAXParseException:prolog中不允许使用内容.
我无法从文件中删除这3个字节.
我无法将文件加载到内存中并在此处删除它们(文件很大).
因此,出于性能原因,我正在使用SAX解析器,如果它们在“”标记之前存在,则只想跳过这3个字节.
我应该为此继承InputStreamReader吗?

我是java的新手 – 请告诉我正确的方法.

解决方法

这已经出现了,当我遇到它时,我在Stack Overflow上发现了 the answer.链接的答案使用PushbackInputStream来测试BOM.

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读