加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 百科 > 正文

如何使用正则表达式删除html语言中的html标记

发布时间:2020-12-14 02:07:49 所属栏目:百科 来源:网络整理
导读:System.Text.RegularExpressions.Regex.Replace(TempContent,"/?[^]+","")搜索 贪婪匹配, 因为所有的HTML标签都是由组成的,所以我的方法是找所有具有""和""的组合, /?[^]+的思想是先找到"",然后再匹配是否有"/"符号,并且用 做转义,而?的作用是匹配
System.Text.RegularExpressions.Regex.Replace(TempContent,"</?[^>]+>","")搜索
贪婪匹配,
因为所有的HTML标签都是由<>组成的,所以我的方法是找所有具有"<"和">"的组合,
</?[^>]+>的思想是先找到"<",然后再匹配是否有"/"符号,并且用

做转义,而?的作用是匹配前面的字符0次或一次,也就是说有“/”这个符号或者是没有这个符号都算匹配成功,继续,[^>] 的意思是不为">"的字符,然后[^>]+中的“+”是匹配一次或者多次,也就是一直匹配到不为">"字符,然后呢,再把">"字符加上,就是最终的匹配结果了。呵呵


补充:Regex.Replace(TempContent,"<[^>]*>","")

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读