使用HTMLAgilityPack c#按类名删除元素
发布时间:2020-12-15 08:29:02 所属栏目:百科 来源:网络整理
导读:我正在使用html敏捷包将我的html文档的内容读成字符串等.完成后,我想删除其内容中的certian元素,但是我遇到了问题. 我的Html看起来像这样: div id="wrapper" div class="maincolumn" div class="breadCrumbContainer" div class="breadCrumbs" /div /div di
我正在使用html敏捷包将我的html文档的内容读成字符串等.完成后,我想删除其内容中的certian元素,但是我遇到了问题.
我的Html看起来像这样: <div id="wrapper"> <div class="maincolumn" > <div class="breadCrumbContainer"> <div class="breadCrumbs"> </div> </div> <div class="SEO_list"> <div class="SEO_head">Header</div> </div> Content goes here... </div> 现在,我使用了一个xpath选择器来获取其中的所有内容,并使用了InnerHtml属性,如下所示: node = doc.DocumentNode.SelectSingleNode("//div[@id='wrapper']"); if (node != null) { pageContent = node.InnerHtml; } 从这一点来说,我想删除带有“breadCrumbContainer”类的div,但是当使用下面的代码时,我收到错误:在集合中找不到“Node”“ node = doc.DocumentNode.SelectSingleNode("//div[@id='wrapper']"); node = node.RemoveChild(node.SelectSingleNode("//div[@class='breadCrumbContainer']")); if (node != null) { pageContent = node.InnerHtml; } 有人可以对此有所了解吗?我对Xpath很新,对HtmlAgility库来说真的很陌生. 谢谢, 戴夫 解决方法
这是因为RemoveChild只能删除一个直接的孩子,而不是一个大孩子.试试这个:
HtmlNode node = doc.DocumentNode.SelectSingleNode("//div[@class='breadCrumbContainer']"); node.ParentNode.RemoveChild(node); (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |