正则表达式 去除相应HTML 标记
将HTML文本中的标记分为:注释,script,style,以及其他标记分别去掉: 1.去注释,正则为: output = Regex.Replace(input,@"<!--[^-]*-->",string.Empty,RegexOptions.IgnoreCase); 2.去script,arial; font-size:14px; line-height:21px"> ouput = Regex.Replace(input,@"<script[^>]*?>.*?</script>",RegexOptions.IgnoreCase | RegexOptions.Singleline); 3.去style,@"<style[^>]*?>.*?</style>",arial; font-size:14px; line-height:21px"> 4.去其他HTML标记 result = result.Replace(" "," "); (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |