加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 编程开发 > Java > 正文

java – 从编码中停止Jsoup

发布时间:2020-12-15 08:41:07 所属栏目:Java 来源:网络整理
导读:我正在尝试使用JSoup来填充URL,其中包含以下文本:?tterni. 解析文档后,相同的字符串看起来像: AElig; tterni. 如何防止这种形式发生?我希望文档1:1与它完全一样. 码: doc = Jsoup.connect(url).get();String docEncoding=doc.outputSettings().charset(
我正在尝试使用JSoup来填充URL,其中包含以下文本:?tterni.
解析文档后,相同的字符串看起来像:& AElig; tterni.

如何防止这种形式发生?我希望文档1:1与它完全一样.

码:

doc = Jsoup.connect(url).get();
String docEncoding=doc.outputSettings().charset().name();
OutputStreamWriter writer = new OutputStreamWriter(new FileOutputStream(localLink),docEncoding);
writer.write(doc.html());
writer.close();

解决方法

使用 ????.doc.outputSettings()escapeMode(EscapeMode.xhtml); 用于避免实体转换.

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读