php正则去除网页中所有的html,js,css,注释的实现方法
发布时间:2020-12-12 21:49:47 所属栏目:PHP教程 来源:网络整理
导读:如下所示: ]*?>'si",// 去掉 HTML 标记 "' ]*?>'si",// 去掉 注释 标记 "'([rn])[s]+'",// 去掉空白字符 "''i",// 替换 HTML 实体 "'(amp|#38);'i","'(lt|#60);'i","'(gt|#62);'i","'(nbsp|#160);'i","'(iexcl|#161);'i","'(cent|#162);'i","'(pound|#163);
如下所示: ]*?>.*?'si",// 去掉 javascript
"''si",// 去掉 css
"'<[/!]*?[^<>]*?>'si",// 去掉 HTML 标记
"' |