加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 百科 > 正文

c# – 使用xml.Load打开HTML文档

发布时间:2020-12-15 17:18:15 所属栏目:百科 来源:网络整理
导读:我想打开一个 HTML文档(作为从StreamReader中检索的字符串,来自网络), 通过这种方式创建 XMLDocument: XmlDocument doc = new XmlDocumentdoc.Load(string containing the retrieved document). 但由于HTML doc包含以下内容: !DOCTYPE html PUBLIC "-//W3C
我想打开一个 HTML文档(作为从StreamReader中检索的字符串,来自网络),
通过这种方式创建 XMLDocument:

XmlDocument doc = new XmlDocument

doc.Load(string containing the retrieved document).

但由于HTML doc包含以下内容:

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd" >

它告诉我文档无效……有什么方法可以解决这个问题吗?

解决方法

普通的html,即使它是有效的html,也不是有效的xml.

有一个名为HtmlAgilityPack的库,它是一个流行的第三方开源库,您可以使用它来解决此问题:

> http://www.google.co.uk/search?q=htmlagilitypack
> How to use HTML Agility pack

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读