c# – 在文档中查找HTML字符串

发布时间：2020-12-15 20:01:34 所属栏目：百科来源：网络整理

导读：我想获取所有 HTML p … / p在一份文件中. 使用 Regex查找所有此类字符串： Regex regex = new Regex(@"p([^]*)/p",RegexOptions.IgnoreCase); 但我无法得到任何结果.我的正则表达式有什么问题吗？现在,我只想获得介于 p … / p之间的所有内容.标签,并

我想获取所有 HTML< p> …< / p>在一份文件中.
使用 Regex查找所有此类字符串：

Regex regex = new Regex(@"&;p&;([^&;]*)&;/p&;",RegexOptions.IgnoreCase);

但我无法得到任何结果.我的正则表达式有什么问题吗？

现在,我只想获得介于< p> …< / p>之间的所有内容.标签,并希望使用正则表达式,因为源不是HTML文档.

解决方法

DO NOT PARSE HTML USING Regular Expressions！

相反,使用HTML Agility Pack.

例如：

var doc = new HtmlDocument();
doc.Load(...);

var pTags = doc.DocumentNode.Descendants("p");

编辑：即使文档实际上不是HTML,您也可以这样做.

（编辑：李大同）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!