加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 百科 > 正文

c# – 在文档中查找HTML字符串

发布时间:2020-12-15 20:01:34 所属栏目:百科 来源:网络整理
导读:我想获取所有 HTML p … / p在一份文件中. 使用 Regex查找所有此类字符串: Regex regex = new Regex(@"p([^]*)/p",RegexOptions.IgnoreCase); 但我无法得到任何结果.我的正则表达式有什么问题吗? 现在,我只想获得介于 p … / p之间的所有内容.标签,并
我想获取所有 HTML< p> …< / p>在一份文件中.
使用 Regex查找所有此类字符串:

Regex regex = new Regex(@"&;p&;([^&;]*)&;/p&;",RegexOptions.IgnoreCase);

但我无法得到任何结果.我的正则表达式有什么问题吗?

现在,我只想获得介于< p> …< / p>之间的所有内容.标签,并希望使用正则表达式,因为源不是HTML文档.

解决方法

DO NOT PARSE HTML USING Regular Expressions!

相反,使用HTML Agility Pack.

例如:

var doc = new HtmlDocument();
doc.Load(...);

var pTags = doc.DocumentNode.Descendants("p");

编辑:即使文档实际上不是HTML,您也可以这样做.

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读