加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 百科 > 正文

SAXREADER读取xml文件,报字节 UTF-8 序列的无效字节 1。 Nested

发布时间:2020-12-16 08:42:41 所属栏目:百科 来源:网络整理
导读:使用saxReader 读取xml文件的时候,报字节 UTF-8 序列的无效字节 1。 Nested exception: 1 字节 UTF-8 序列的无效字节 1。 去掉xml文件的中文注释时,没有报错。发现文本存放的编码为ANSI所致。将文本另存为utf-8格式,再重新读xml文件,没有出现问题了 。

使用saxReader 读取xml文件的时候,报字节 UTF-8 序列的无效字节 1。 Nested exception: 1 字节 UTF-8 序列的无效字节 1。

去掉xml文件的中文注释时,没有报错。发现文本存放的编码为ANSI所致。将文本另存为utf-8格式,再重新读xml文件,没有出现问题了 。

出现该问题的时候,百度,先前有人遇到同样的问题,解决办法:xml中1字节的UTF-8序列的字节1无效

今天在eclipse中编写pom.xml文件时,注释中的中文被eclipse识别到错误:Invalid byte 1 of 1-byte UTF-8 sequence,曾多次遇到该问题,问题的根源是:

The cause of this is a file that is notUTF-8is being parsed as UTF-8. It is likely that the parser is encountering a byte value in the rangeFE-FF. These values are invalid in the UTF-8 encoding.

但这次很诡异,我使用notepad++将pom.xml的编码保存为“UTF-8无BOM”形式,pom.xml文件内的encoding属性设置为“UTF-8”,问题依旧啊,郁闷了,难道上述的理论有问题?还是eclipse的bug呢?在网上看了半天,基本都是这么说的。

第一,可以直接在XML文件中更改UTF-8为GBK或GB2312

<?xml version="1.0" encoding="GB2312"?>

第二,可以在Eclipse中更改,在 eclipse 的功能表 [Project]→[Properties],點選 [Resources],在右邊的「Text file encoding」,把原來是系統預設的編碼,改為 「UTF-8」。

第一种方案可行,属于逃避的方法,放弃!第二种也不是解决我这种问题的,继续网上搜索惊奇的发现,原来解决方案是这样的:

把xml的encoding属性值UTF-8改为UTF8

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读