C#使用正则表达式过滤html标签
发布时间:2020-12-15 06:21:56 所属栏目:百科 来源:网络整理
导读:在项目中遇到这样一个需求,需要将一段html转换为一般文本返回,万能的正则表达式来了。 正则表达式来拯救你,代码如下: public static string Html2Text(string htmlStr){if (String.IsNullOrEmpty(htmlStr)){return "";}string regEx_style = "style[^]*[
在项目中遇到这样一个需求,需要将一段html转换为一般文本返回,万能的正则表达式来了。 正则表达式来拯救你,代码如下: public static string Html2Text(string htmlStr) { if (String.IsNullOrEmpty(htmlStr)) { return ""; } string regEx_style = "<style[^>]*?>[sS]*?</style>"; //定义style的正则表达式 string regEx_script = "<script[^>]*?>[sS]*?</script>"; //定义script的正则表达式 string regEx_html = "<[^>]+>"; //定义HTML标签的正则表达式 htmlStr = Regex.Replace(htmlStr,regEx_style,"");//删除css htmlStr = Regex.Replace(htmlStr,regEx_script,"");//删除js htmlStr = Regex.Replace(htmlStr,regEx_html,"");//删除html标记 htmlStr = Regex.Replace(htmlStr,"s*|t|r|n","");//去除tab、空格、空行 htmlStr = htmlStr.Replace(" ",""); htmlStr = htmlStr.Replace(""","");//去除异常的引号" " " htmlStr = htmlStr.Replace(""",""); return htmlStr.Trim(); } 以上所述是小编给大家介绍的C#使用正则表达式过滤html标签 ,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对编程小技巧网站的支持! (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |