加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 大数据 > 正文

perl一次读取多行文本的策略

发布时间:2020-12-15 23:54:41 所属栏目:大数据 来源:网络整理
导读:在处理文本时,常常遇到这样的情况:就是我们需要把两行文本做一个比较,然后选择性输出。而在while(FILEHAND){do something}程序块中默认只能一次读取一行。笔者在这里,举一个简单的例子来说明怎么处理这种情况。 有一个这样一段文本: a 1 2 3 4 a 5 6

在处理文本时,常常遇到这样的情况:就是我们需要把两行文本做一个比较,然后选择性输出。而在while(<FILEHAND>){do something}程序块中默认只能一次读取一行。笔者在这里,举一个简单的例子来说明怎么处理这种情况。

有一个这样一段文本:

a 1 2 3 4
a 5 6 7 8
a 6 7 8 9
a 7 8 9 11
a 7 8 9 12
a 13 12 14 15
a 18 14 16 17
a 2 3 4 65


要求是这样的:如果上一行的第5列数字大于下一行第二列的数字,就把这两行都输出。

策略一:把输入文本存放到数组中,然后利用for循环,一次输出两行做判断。

脚本如下:

#! /usr/bin/perl -w
use strict;
chomp(my @a=<DATA>);
my @out;
for(my $i=0;$i<$#a;$i++){
        my ($a1,$a2)=(split/s+/,$a[$i])[1,4];
        my ($b1,$b2)=(split/s+/,$a[$i+1])[1,4];
        push @out,@a[$i,$i+1]  if $a2 > $b1;
}
my %ha;
my @new=grep {$ha{$_}++<1}@out;
print $_,"n" for@new;
__DATA__
a 1 2 3 4
a 5 6 7 8
a 6 7 8 9
a 7 8 9 11
a 7 8 9 12
a 13 12 14 15
a 18 14 16 17
a 2 3 4 65

策略一思路比较简单,但是如果输入文本过大,比较消耗内存。当然使用Tie::File模块又是另外一回事情了。

在这里,笔者利用tell和seek函数,对句柄定位做一下调整,就可以在while循环中,实现一次输出多行,一行多次输出了,是不是很方便呢?

代码如下:

#! /usr/bin/perl -w
use strict;
my @out;
while(<DATA>){
        chomp;
        my $pos=tell(DATA);
        my @a=split/s+/,$_;
        my $sec=<DATA>;
        if($sec){
                chomp$sec;
                my @b=split/s+/,$sec;
                if($a[4]>$b[1]){
                        push @out,$_,$sec;
                }
        }
        seek(DATA,$pos,0);
}
my %ha;
my @new=grep $ha{$_}++ < 1,@out;
print $_,"n" for@new;
__DATA__
a 1 2 3 4
a 5 6 7 8
a 6 7 8 9
a 7 8 9 11
a 7 8 9 12
a 13 12 14 15
a 18 14 16 17
a 2 3 4 65


程序运行的结果如下:

a 5 6 7 8
a 6 7 8 9
a 7 8 9 11
a 7 8 9 12
a 18 14 16 17
a 2 3 4 65


__结束__

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读