如何使用正则表达式删除html语言中的html标记

发布时间：2020-12-14 02:07:49 所属栏目：百科来源：网络整理

导读：System.Text.RegularExpressions.Regex.Replace(TempContent,"/?[^]+","")搜索贪婪匹配，因为所有的HTML标签都是由组成的，所以我的方法是找所有具有""和""的组合， /?[^]+的思想是先找到""，然后再匹配是否有"/"符号，并且用做转义，而?的作用是匹配

System.Text.RegularExpressions.Regex.Replace(TempContent,"</?[^>]+>","")搜索
贪婪匹配，
因为所有的HTML标签都是由<>组成的，所以我的方法是找所有具有"<"和">"的组合，
</?[^>]+>的思想是先找到"<"，然后再匹配是否有"/"符号，并且用

做转义，而?的作用是匹配前面的字符0次或一次，也就是说有“/”这个符号或者是没有这个符号都算匹配成功，继续，[^>] 的意思是不为">"的字符，然后[^>]+中的“+”是匹配一次或者多次，也就是一直匹配到不为">"字符，然后呢，再把">"字符加上，就是最终的匹配结果了。呵呵

补充：Regex.Replace(TempContent,"<[^>]*>","")

（编辑：李大同）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!