C语言中判断一个char*是不是utf8编码
发布时间:2020-12-16 05:08:36 所属栏目:百科 来源:网络整理
导读:C语言中判断一个char*是不是utf8编码 里我修改了一下,纯ASCII编码的字符串也返回true,因为UTF8和ASCII兼容 实例代码: int utf8_check(const char* str,size_t length) { size_t i; int nBytes; unsigned char chr; i = 0; nBytes = 0; while (i length) { c
C语言中判断一个char*是不是utf8编码 里我修改了一下,纯ASCII编码的字符串也返回true,因为UTF8和ASCII兼容 实例代码: int utf8_check(const char* str,size_t length) { size_t i; int nBytes; unsigned char chr; i = 0; nBytes = 0; while (i < length) { chr = *(str + i); if (nBytes == 0) { //计算字节数 if ((chr & 0x80) != 0) { while ((chr & 0x80) != 0) { chr <<= 1; nBytes++; } if ((nBytes < 2) || (nBytes > 6)) { return 0; //第一个字节最少为110x xxxx } nBytes--; //减去自身占的一个字节 } } else { //多字节除了第一个字节外剩下的字节 if ((chr & 0xC0) != 0x80) { return 0; //剩下的字节都是10xx xxxx的形式 } nBytes--; } i++; } return (nBytes == 0); } 感谢阅读,希望能帮助到大家,谢谢大家对本站的支持! (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |