加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 编程开发 > Java > 正文

使用Java将HTML文件读入DOM树

发布时间:2020-12-14 16:28:36 所属栏目:Java 来源:网络整理
导读:有没有解析器/库能够使用 Java将HTML文档读入DOM树?我想使用Java提供的标准DOM / Xpath API. 大多数库似乎有自定义的API来解决这个任务.此外,转换为XML-DOM的HTML似乎不受大多数??可用解析器的支持. 任何想法或经验与一个好的HTML DOM解析器? 解决方法 JTi
有没有解析器/库能够使用 Java将HTML文档读入DOM树?我想使用Java提供的标准DOM / Xpath API.

大多数库似乎有自定义的API来解决这个任务.此外,转换为XML-DOM的HTML似乎不受大多数??可用解析器的支持.

任何想法或经验与一个好的HTML DOM解析器?

解决方法

JTidy,通过将流处理为XHTML,然后使用您最喜欢的DOM实现来重新解析,或者使用parseDOM,如果有限的DOM imp给出足够的.

或者Neko.

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读