正则表达式 – 如何在正则表达式中使用awk for循环的索引
发布时间:2020-12-14 05:50:03 所属栏目:百科 来源:网络整理
导读:我把问题缩短了.实际上我的数据比这长得多. 我有一个像这样的文件: aa,bb,cc,dd,ee,4ff,gg,hh,ii,jj,5kk,ll,mm,nn,oo,3pp,qq,rr,ss,tt,2uu,vv,ww,xx,yy,5aa,2 现在我想使用awk选择最后一列中具有相同编号的每一行并将其重定向到一个新文件,这些新文件将根据
我把问题缩短了.实际上我的数据比这长得多.
我有一个像这样的文件: aa,bb,cc,dd,ee,4 ff,gg,hh,ii,jj,5 kk,ll,mm,nn,oo,3 pp,qq,rr,ss,tt,2 uu,vv,ww,xx,yy,5 aa,2 现在我想使用awk选择最后一列中具有相同编号的每一行并将其重定向到一个新文件,这些新文件将根据最后一列中的数字而有所不同. 在t2.txt中: pp,2 aa,2 在t3.txt中: kk,3 在t4.txt中: aa,4 在t5.txt中: ff,5 uu,5 我想我需要这样的东西: BEGIN {FS=","} { for (n=2; n<=5; n++) if ($6 ~/$n/) {print > "t$n.txt"} } 但我只是不知道如何使它工作. 这个bash文件做我想要的,但问题是,每次它提取具有特定数字的行时,它必须读入所有行.如何仅查看文件的时间并提取所有数字的文件? #!/bin/bash for num in {2..5}; do gawk --assign FS="," "$6 ~/${num}/" infile >> t${num}.txt done 解决方法
尝试使用下一个命令:
awk '{ print $0 > ("t" $NF ".txt") }' infile 无需更改FS,因为它默认为空格字符.并且您可以使用NF变量进行最后一个字段的访问. 注意:文件名字符串连接需要包含在parens中,否则awk会因非法语法而混淆. (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |