加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 综合聚焦 > 服务器 > Windows > 正文

在Windows中识别unicode编码的文本文件的最好方法是什么?

发布时间:2020-12-13 20:14:37 所属栏目:Windows 来源:网络整理
导读:由于多个团队成员使用不同的编辑器(和默认设置)进行开发,因此我正在处理一些代码库,其中包含一些unicode编码文件.我想通过查找所有unicode编码的文件并将其转换回ANSI编码来清理我们的代码库. 任何关于如何完成这项任务的“寻找”部分的想法都将得到真正的赞
由于多个团队成员使用不同的编辑器(和默认设置)进行开发,因此我正在处理一些代码库,其中包含一些unicode编码文件.我想通过查找所有unicode编码的文件并将其转换回ANSI编码来清理我们的代码库.

任何关于如何完成这项任务的“寻找”部分的想法都将得到真正的赞赏.

见 “How to detect the character encoding of a text-file?”或 “How to reliably guess the encoding […]?”

> UTF-8可以通过验证检测.您也可以寻找BOM EF BB BF,但不要依赖它.
可以通过查找BOM来检测UTF-16.
> UTF-32可以通过验证或BOM来检测.
>否则假设ANSI代码页.

Our codebase doesn’t include any
non-ASCII chars. I will try to grep
for the BOM in files in our codebase.
Thanks for the clarification.

这样做使事情变得更简单.没有非ASCII字符的UTF-8是ASCII.

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读