加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 站长学院 > PHP教程 > 正文

php – mb_substr在剥离UTF-8文本时在末尾添加3个点(…),并且当

发布时间:2020-12-13 16:20:18 所属栏目:PHP教程 来源:网络整理
导读:我有这样的代码: if(strlen($text)=15)$text=mb_substr($text,15,'UTF-8'); 它的工作原理应该如此,但事实是,当文本是拉丁文(例如英文)时,当它将其剥离时,它最终不会显示3个点.另一方面,当文本处于需要UTF-8编码的其他语言时,它最后会添加3个点. 例: What a
我有这样的代码:

if(strlen($text)>=15)
$text=mb_substr($text,15,'UTF-8');

它的工作原理应该如此,但事实是,当文本是拉丁文(例如英文)时,当它将其剥离时,它最终不会显示3个点.另一方面,当文本处于需要UTF-8编码的其他语言时,它最后会添加3个点.

例:

What are cells made of

被取代

What are cells

另一方面:

で作られた細胞は何ですか

被取代

で作られた細 …

我错过了什么?

解决方法

这是因为 strlen()以二进制形式返回字符串的长度,即八位字节的数量.

因为utf8以与例如相同的方式表示ASCII. iso-8859-1,字符数和八位字节数没有区别.但是,对于ASCII以外的字符,每个utf8字符最多可占用三个八位字节,例如亚洲字符.

因此,要正确确定字符数,您需要使用mb_strlen().

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读