加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 大数据 > 正文

perl windows编码问题

发布时间:2020-12-16 00:38:03 所属栏目:大数据 来源:网络整理
导读:http://bbs.chinaunix.net/thread-1857627-1-1.html 同学们近期编码问题很多,稍微总结下。 Windows 的终端环境是GBK吧,读取UTF-8的 编码,自然会乱码。 比如 文件 abc.txt是UTF-8格式的,那么如何读取它 呢? 第一种方式: 使用带encoding参数的open打开和

http://bbs.chinaunix.net/thread-1857627-1-1.html

同学们近期编码问题很多,稍微总结下。

Windows的终端环境是GBK吧,读取UTF-8的 编码,自然会乱码。

比如文件abc.txt是UTF-8格式的,那么如何读取它 呢?

第一种方式:

使用带encoding参数的open打开和读入文件,并转换成gb2312输出:

  1. use strict;
  2. use Encode;
  3. ?
  4. open HD,"<:encoding(UTF-8)","abc.txt" or die $!;
  5. while(<HD>) {
  6. ? ? ? ? print encode("gb2312",$_);
  7. }
  8. close HD;
复制 代码

如上代码,<:encoding(UTF-8)表明在open时,已识别并转换了读入文件的UTF-8编码。


然后print encode("gb2312",$_)将内容用gb2312编码输出,这样就正确显示了。




第二种方式:



使用Encode模块的decode函数自己处理转换,如下:

  1. use strict;
  2. use Encode;
  3. ?
  4. open HD,decode("utf8",$_));
  5. }
  6. close HD;
复制 代码

用普通的open打开文件,然后对文件的每一行,先用decode将内容转换成

perl

内部的编码格式(它的作用相当于open with "<:encoding(UTF-8)")。


然后,再调用encode将转换后的内容,以gb2312编码进行输出,这样也显示正常。




其他方式。。待总结。


其他编码之间转换,也按此类推。

-------------------------------------------

perl linux-windows socket中文字符有问题,使用第二种方式解决了

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读