加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 大数据 > 正文

Perl – 汇总文件中的数据

发布时间:2020-12-16 06:16:30 所属栏目:大数据 来源:网络整理
导读:什么是从Perl中有大约200万条记录的文件中汇总数据的最佳方法? 例如:这样的文件, ABC | XYZ | DEF | EGH | 100 ABC | XYZ | DEF | FGH | 200 SDF | GHT | WWW | RTY | 1000 SDF | GHT | WWW | TYU | 2000 需要在前3列中总结如下, ABC | XYZ | DEF | 300 SD
什么是从Perl中有大约200万条记录的文件中汇总数据的最佳方法?

例如:这样的文件,

ABC | XYZ | DEF | EGH | 100

ABC | XYZ | DEF | FGH | 200

SDF | GHT | WWW | RTY | 1000

SDF | GHT | WWW | TYU | 2000

需要在前3列中总结如下,

ABC | XYZ | DEF | 300

SDF | GHT |万维网| 3000

克里斯

解决方法

假设总共有五列,其中第五列是数字,并且您总是希望前三列成为关键…

use warnings;
use strict;

my %totals_hash;

while (<>)
{
  chomp;
  my @cols = split /|/;

  my $key = join '|',@cols[0..2];

  $totals_hash{$key} += $cols[4];
}

foreach (sort keys %totals_hash)
{
  print $_,'|',$totals_hash{$_},"n";
}

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读