加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 大数据 > 正文

如何在Perl中将命令行参数视为UTF-8?

发布时间:2020-12-15 21:30:56 所属栏目:大数据 来源:网络整理
导读:如何在Perl中将@ARGV的元素视为UTF-8? 目前我正在使用以下工作方式 use Encode qw(decode encode);my $foo = $ARGV[0];$foo = decode("utf-8",$foo); 它的作品,但不是很优雅. 我正在使用Perl v5.8.8,它是从bash v3.2.25调用的,LANG设置为en_US.UTF-8. 解决
如何在Perl中将@ARGV的元素视为UTF-8?

目前我正在使用以下工作方式

use Encode qw(decode encode);

my $foo = $ARGV[0];
$foo = decode("utf-8",$foo);

它的作品,但不是很优雅.

我正在使用Perl v5.8.8,它是从bash v3.2.25调用的,LANG设置为en_US.UTF-8.

解决方法

外部数据源在Perl中很棘手.对于命令行参数,您可能会将它们作为您的语言环境中指定的编码.不要依赖你的地区与其他可能运行你的程序的人一样.

你必须找出那些转换为Perl的内部格式.幸运的是,这并不困难.

I18N::Langinfo模块具有您需要获取编码的内容:

use I18N::Langinfo qw(langinfo CODESET);
    my $codeset = langinfo(CODESET);

一旦你知道编码,你可以将它们解码成Perl字符串:

use Encode qw(decode);
    @ARGV = map { decode $codeset,$_ } @ARGV;

虽然Perl将内部字符串编码为UTF-8,但您不应该想到或知道这一点.您只需解码您获得的任何内容,并将其转换为Perl的内部代表.相信Perl会处理一切.当您需要存储数据时,请确保使用您喜欢的编码.

如果您知道您的设置是UTF-8,并且终端将以UTF-8的形式提供命令行参数,则可以使用Perl C开关的A选项.这告诉你的程序假设参数被编码为UTF-8:

% perl -CA program

您也可以使用-C,它会打开其他几个Unicode选项:

% perl -C program

我发现“如果你知道”是一个大的红旗,那真的意味着“我们不确定”.

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读