如何将windows-1250 / Cp1250中编码的String转换为utf-8?
发布时间:2020-12-14 19:21:16 所属栏目:Java 来源:网络整理
导读:正如标题所说 我从htto响应中读到了内容 InputStream is = response.getEntity().getContent(); String cw = IOUtils.toString(is); byte[] b = cw.getBytes("Cp1250"); String x = StringUtils.newStringUtf8(b); String content = new String(b,"UTF-8");
正如标题所说……
我尝试了很多变化.我对用作字符串的正确编码常量有点困惑. windows-1250或Cp1250. UTF-8或utf-8还是utf8? 最佳答案
您似乎认为String对象具有编码.那不对.编码用作从二进制数据(byte []或InputStream)到文本数据(String或char []等)的转换的一部分.
目前尚不清楚IOUtils.toString正在做什么,但它几乎肯定会丢失数据或至少不恰当地处理它.如果您的数据最初是在Windows-1250中,那么您应该使用包装InputStream的InputStreamReader,在InputStreamReader构造函数调用中指定charset. 目前尚不清楚UTF-8的用武之地 – 您可能希望之后以UTF-8写出数据,但结果将是byte [],而不是字符串. (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |