c# – 在文档中查找HTML字符串
发布时间:2020-12-15 20:01:34 所属栏目:百科 来源:网络整理
导读:我想获取所有 HTML p … / p在一份文件中. 使用 Regex查找所有此类字符串: Regex regex = new Regex(@"p([^]*)/p",RegexOptions.IgnoreCase); 但我无法得到任何结果.我的正则表达式有什么问题吗? 现在,我只想获得介于 p … / p之间的所有内容.标签,并
我想获取所有
HTML< p> …< / p>在一份文件中.
使用 Regex查找所有此类字符串: Regex regex = new Regex(@"&;p&;([^&;]*)&;/p&;",RegexOptions.IgnoreCase); 但我无法得到任何结果.我的正则表达式有什么问题吗? 现在,我只想获得介于< p> …< / p>之间的所有内容.标签,并希望使用正则表达式,因为源不是HTML文档. 解决方法
DO NOT PARSE HTML USING Regular Expressions!
相反,使用HTML Agility Pack. 例如: var doc = new HtmlDocument(); doc.Load(...); var pTags = doc.DocumentNode.Descendants("p"); 编辑:即使文档实际上不是HTML,您也可以这样做. (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |