php preg_replace空格无法替换问题
一次坑爹的小bug。读取一段文字(编码utf-8),想替换掉空格,str_replace(" "..)、preg_replace("/s/"..)都不起作用。 ? 1 <?php 2 3 $str = '<p>????你好<p>'; 4 $str = preg_replace('/s/is','',$c); 5 str_replace(" ","a",1)">$str); 6 var_dump($str); //不起作用 ? 没办法,将替换不了的空格ord()下才看到,这个utf-8空格比较特殊。ASCII 194 + 160出来的。 ? str_replace(chr(194) . chr(160),1)">$str); 解决方法1 preg_replace('/xC2xA0/is',1)"> 解决方法2 ok ? ? 问题的根源,在于UTF-8这种编码里面,存在一个特殊的字符,其编码是“0xC2 0xA0”(194 160),转换成字符的时候,表现为一个空格,跟一般的半角空格(ASCII 0x20)一样,唯一的不同是它的宽度不会被压缩,因此比较多的被用于网页排版(如首行缩进之类)。而其他的编码方式如GB2312、Unicode之类并没有这样的字符。 整理遇到的各种无法替换的字符: chr(194).chr(160) 变现为空格 chr(227).chr(128) 变现为空格 chr(226).chr(128).chr(172).chr(226).chr(128).chr(172).chr(30) 变现为空 ? ? 总结:替换不了的字符,打印出ASCII码来总能替换掉吧。 (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |