PHP编程:PHP实现通过中文字符比率来判断垃圾评论的方法
《PHP实现通过中文字符比率来判断垃圾评论的方法》要点: PHP实例本篇章节讲解PHP实现通过中文字符比率来判断垃圾评论的办法.分享给大家供大家参考.具体实现办法如下: PHP实例一、需求: PHP实例最近一段时间常常出现这类垃圾评论:一大段英文字符里夹杂一两个生僻汉字,包含了中文字符,而且又没包含啥中文的敏感词,所以就堂而皇之的通过了评论过滤.对这类评论的处理可以采取判断中文字符的比率来确认,但是也会存在一定的误判. PHP实例二、办理方案: PHP实例要用到php的两个函数strlen和mb_strlen,strlen会把单个汉字长度认定为3,mb_strlen单个汉字长度为1.同一段字符通过两个函数取得的长度之差就是实际汉字字符数的二倍,除以二就得到实际的字符数,在与mb_strlen取得的长度求比值就得到汉字占总字符数的比率. PHP实例三、实现代码:
代码如下:
$len_all = strlen($comment['text']);?????????????????????
?$len_st = mb_strlen($comment['text'],'UTF-8'); ?if(($len_all-$len_st)/(2*$len_st) < 0.5){ ??????? $error = "中文字符少于百分之五十";? ?} PHP实例如果在评论中贴代码的话,就会造成中文字符比率低,需要过滤掉代码字段再来判断. PHP实例希望本文所述对大家的PHP程序设计有所赞助. 编程之家培训学院每天发布《PHP实现通过中文字符比率来判断垃圾评论的方法》等实战技能,PHP、MYSQL、LINUX、APP、JS,CSS全面培养人才。 (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |