UTF-8正则表达式如何匹配汉字
《PHP实例:UTF-8正则表达式如何匹配汉字》要点: 判断输入内容是否含有违法字符,请看下面代码PHP应用 $str = "编程"; // if(!preg_match("/^[x{4e00}-x{9fa5}A-Za-z0-9_]+$/u",$str)) //UTF-8汉字字母数字下划线正则表达式 if(!preg_match("/^[x{4e00}-x{9fa5}]+$/u",$str)) //UTF-8汉字字母数字下划线正则表达式 { echo "<font color=red>您输入的[".$str."]含有违法字符</font>"; } else { echo "<font color=green>您输入的[".$str."]完全合法,通过!</font>"; } ----------------------- UTF-8匹配: 好比:
代码如下:
?var str = "php编程"; ?if (/^[u4e00-u9fa5]+$/.test(str)) { alert("该字符串全部是中文"); }? else{ alert("该字符串不全部是中文"); ?} php中,是用x表示十六进制数据的. 于是,变换成如下的代码:
代码如下:
?$str = "php编程"; if (preg_match("/^[x4e00-x9fa5]+$/",$str)) { print("该字符串全部是中文"); } else { print("该字符串不全部是中文"); } 貌似不报错了,判断的结果也正确,不过把$str换成“编程”两字,结果却还是显示“该字符串不全部是中文”,看来这样的判断还是不够准确. 查阅了<精通正则表达式>发现,对于[x4e00-x9fa5]这块东西,本身做一个强化的解释 网上只能找到匹配全角字符的正则:?? ^[x80-xff]*^/??,这里可以不加大括号 [u4e00-u9fa5]可以匹配中文,但是PHP又不支持???? 不过,既然x表示的十六进制数据,为什么和js里边提供的范围x4e00-x9fa5不一样呢? 于是我就换成了下边的代码,发现真的准确了:
代码如下:
?$str = "php编程"; ?if (preg_match("/^[x{4e00}-x{9fa5}]+$/u",$str)) { print("该字符串全部是中文"); } else { print("该字符串不全部是中文"); ?} 知道了php中utf-8编码下用正则表达式匹配汉字的最终正确表达式――/^[x{4e00}-x{9fa5}]+$/u,参考以上文章写了如下一段测试代码(复制以下代码保留成.php文件) <?php $action = trim($_GET['action']); if($action == "sub") { $str = $_POST['dir']; //if(!preg_match("/^[".chr(0xa1)."-".chr(0xff)."A-Za-z0-9_]+$/",$str)) //GB2312汉字字母数字下划线正则表达式 if(!preg_match("/^[x{4e00}-x{9fa5}A-Za-z0-9_]+$/u",$str)) //UTF-8汉字字母数字下划线正则表达式 { echo "<font color=red>您输入的[".$str."]含有违法字符</font>"; } else { echo "<font color=green>您输入的[".$str."]完全合法,通过!</font>"; } } ?<form method="POST" action="?action=sub"> 输入字符(数字,字母,汉字,下划线): <input type="text" name="dir" value=""> <input type="submit" value="提交"> </form> GBK:
代码如下:
preg_match("/^[".chr(0xa1)."-".chr(0xff)."A-Za-z0-9_]+$/",$str); //GB2312汉字字母数字下划线正则表达式 以上内容便是PHP中UTF-8正则表达式如何匹配汉字的全部内容,希望大家喜欢. 《PHP实例:UTF-8正则表达式如何匹配汉字》是否对您有启发,欢迎查看更多与《PHP实例:UTF-8正则表达式如何匹配汉字》相关教程,学精学透。编程之家 52php.cn为您提供精彩教程。 (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |