perl – Can Encode ::猜猜从iso-8859-1告诉utf-8?
发布时间:2020-12-15 21:45:50 所属栏目:大数据 来源:网络整理
导读:我有一个字符串$data,用utf-8编码.我假设我不知道这个字符串是utf-8还是iso-8859-1.我想使用Perl Encode :: Guess模块??来查看它是否是其中之一.我无法弄清楚这个模块是如何工作的. 我尝试了以下四种方法(从http://perldoc.perl.org/Encode/Guess.html开始)
我有一个字符串$data,用utf-8编码.我假设我不知道这个字符串是utf-8还是iso-8859-1.我想使用Perl Encode :: Guess模块??来查看它是否是其中之一.我无法弄清楚这个模块是如何工作的.
我尝试了以下四种方法(从http://perldoc.perl.org/Encode/Guess.html开始): use Encode::Guess qw/utf8 latin1/; my $decoder = guess_encoding($data); print "$decodern"; 结果:iso-8859-1或utf8 use Encode::Guess qw/utf8 latin1/; my $enc = guess_encoding($data,qw/utf8 latin1/); ref($enc) or die "Can't guess: $enc"; my $utf8 = $enc->decode($data); print "$utf8n"; 结果:无法猜测:iso-8859-1或utf8 at encodage-windows.pl第25行,第18110行. use Encode::Guess qw/utf8 latin1/; my $decoder = Encode::Guess->guess($data); die $decoder unless ref($decoder); my $utf8 = $decoder->decode($data); print "$utf8n"; 结果:iso-8859-1或utf8 at encodage-windows.pl第30行,第18110行. use Encode::Guess qw/utf8 latin1/; my $utf8 = Encode::decode("Guess",$data); print "$utf8n"; 结果:iso-8859-1或utf8位于/usr/local/lib/perl5/Encode.pm第175行. 我的第一个问题是:我应该使用哪种方法(如果有的话)? 解决方法
我通常一次检查一个可能的编码,就像这样
my $decoder = guess_encoding($data,'utf8'); $decoder = guess_encoding($data,'iso-8859-1') unless ref $decoder; die $decoder unless ref $decoder; printf "Decoding as %snn",$decoder->name; $data = $decoder->decode($data); 如果可能的话,它选择UTF-8,否则它会尝试ISO-8859-1,并选择那个或错误,因此每个编码都会变成一个简单的是/否结果,并且没有办法让它得出两个可能的结果(这是你得到的错误). (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |