加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 站长学院 > PHP教程 > 正文

PHP正确解析UTF-8字符串

发布时间:2020-12-13 20:34:52 所属栏目:PHP教程 来源:网络整理
导读:$str = 今天非常Happy,所有决定去KFC吃可乐鸡翅!!! ; /* $str是待截取的字符串 $len是截取的字符数 */ function utf8sub( $str , $len ){ if ( $len =0){ return ; } $offset =0; //截取高位字节时的偏移量 $chars =0; //截取到的字符数 $res = ; //存放截
  1. $str = '今天非常Happy,所有决定去KFC吃可乐鸡翅!!!'
  2. /* 
  3. $str 是待截取的字符串 
  4. $len 是截取的字符数 
  5. */ 
  6. function utf8sub($str,$len) { 
  7.  if($len <= 0){ 
  8.   return ''
  9.  } 
  10.   
  11.  $offset = 0; // 截取高位字节时的偏移量 
  12.  $chars = 0;  // 截取到的字符数 
  13.  $res = '';   // 存放截取的结果字符串 
  14.   
  15.  while($chars < $len){ 
  16.   // 先取字符串的第一个字节 
  17.   // 将它转为十进制 
  18.   // 再转为二进制 
  19.   $high = ord(substr($str,$offset,1)); 
  20.    
  21.   // echo '$high='. $high .'<br />'; 
  22.   if($high == null ){ // 如果取出高位为null,证明已经取到末尾,直接break 
  23.    break
  24.   }   
  25.   if(($high>>2) === 0x3F){ // 将高位右移2位,和二进制222221比较,相同则取6个字节 
  26.    // 截取2个字节 
  27.    $count = 6; 
  28.   }else if(($high>>3) === 0x1F){ // 将高位右移2位,和二进制22222比较,相同则取5个字节 
  29.    // 截取3个字节 
  30.    $count = 5; 
  31.   }else if(($high>>4) === 0xF){ // 将高位右移2位,和二进制1111比较,相同则取4个字节 
  32.   
  33.    // 截取4个字节 
  34.    $count = 4; 
  35.   }else if(($high>>5) === 0x7){ // 将高位右移2位,和二进制111比较,相同则取3个字节 
  36.    
  37.    // 截取5个字节 
  38.    $count = 3; 
  39.   }else if(($high>>6) === 0x3){ // 将高位右移2位,和二进制11比较,相同则取2个字节 
  40.    // 截取6个字节 
  41.    $count = 2; 
  42.   }else if(($high>>7) === 0x0){ // 将高位右移2位,和二进制0比较,相同则取1个字节 
  43.    $count = 1; 
  44.   } 
  45.   // echo '$count='.$count.'<br />'; 
  46.    
  47.   $res .= substr($str,$count); // 取出一个字符与$res字符串连接 
  48.   $chars += 1;  // 截取到的字符数+1 
  49.   $offset += $count;  // 截取高位偏移量向后移$count字节  
  50.  } 
  51.  return $res
  52. echo utf8sub($str,100); 

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读