bash – Unix:计算第一列中类似条目的出现次数,对第二列求和
发布时间:2020-12-15 21:33:49 所属栏目:安全 来源:网络整理
导读:我有一个包含两列数据的文件,我想计算第一列中相似性的出现.当匹配第一列中的两个相似条目时,我还想对两个匹配条目的第二列的值求和. 示例列表: 2013-11-13-03 12013-11-13-06 12013-11-13-13 22013-11-13-13 12013-11-13-15 12013-11-13-15 12013-11-13-15
我有一个包含两列数据的文件,我想计算第一列中相似性的出现.当匹配第一列中的两个相似条目时,我还想对两个匹配条目的第二列的值求和.
示例列表: 2013-11-13-03 1 2013-11-13-06 1 2013-11-13-13 2 2013-11-13-13 1 2013-11-13-15 1 2013-11-13-15 1 2013-11-13-15 1 2013-11-13-17 1 2013-11-13-23 1 2013-11-14-01 1 2013-11-14-04 6 2013-11-14-07 1 2013-11-14-08 1 2013-11-14-09 1 2013-11-14-09 1 我希望输出读取类似于以下内容 2013-11-13-03 1 1 2013-11-13-06 1 1 2013-11-13-13 2 3 2013-11-13-15 3 3 2013-11-13-17 1 1 2013-11-13-23 1 1 2013-11-14-01 1 1 2013-11-14-04 1 6 2013-11-14-07 1 1 2013-11-14-08 1 1 2013-11-14-09 2 2 第1列是前面示例第1列中的匹配列,第2列是前一示例中第1列的匹配计数(如果没有其他匹配,则为1),第3列是来自匹配列1的第2列的总和前面的例子.任何人都有使用awk或uniq和awk的混合物完成此任何提示? 解决方法
这是一个awk和sort的快速:
awk ' { counts[$1]++; # Increment count of lines. totals[$1] += $2; # Accumulate sum of second column. } END { # Iterate over all first-column values. for (x in counts) { print x,counts[x],totals[x]; } } ' file.txt | sort 如果您不关心输出行的顺序,可以跳过排序. (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |