如何使用正则表达式删除html语言中的html标记
发布时间:2020-12-14 02:07:49 所属栏目:百科 来源:网络整理
导读:System.Text.RegularExpressions.Regex.Replace(TempContent,"/?[^]+","")搜索 贪婪匹配, 因为所有的HTML标签都是由组成的,所以我的方法是找所有具有""和""的组合, /?[^]+的思想是先找到"",然后再匹配是否有"/"符号,并且用 做转义,而?的作用是匹配
System.Text.RegularExpressions.Regex.Replace(TempContent,"</?[^>]+>","")搜索 贪婪匹配, 因为所有的HTML标签都是由<>组成的,所以我的方法是找所有具有"<"和">"的组合, </?[^>]+>的思想是先找到"<",然后再匹配是否有"/"符号,并且用 做转义,而?的作用是匹配前面的字符0次或一次,也就是说有“/”这个符号或者是没有这个符号都算匹配成功,继续,[^>] 的意思是不为">"的字符,然后[^>]+中的“+”是匹配一次或者多次,也就是一直匹配到不为">"字符,然后呢,再把">"字符加上,就是最终的匹配结果了。呵呵
补充:Regex.Replace(TempContent,"<[^>]*>","") (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |