bash – 根据其他文件中的列搜索文件中的字符串

发布时间：2020-12-15 22:50:41 所属栏目：安全来源：网络整理

导读：如果我们有第一个文件如下： (a.txt) 1 asm 2 assert 3 bio 4 Bootasm 5 bootmain 6 buf 7 cat 8 console 9 defs10 echo 第二个像： (b.txt) bio cat BIO bootasm bio defs cat Bio console bio BiO bIo assert bootasm asm bootasm echo bootasm console bo

如果我们有第一个文件如下：

(a.txt)
 1  asm
 2  assert
 3  bio
 4  Bootasm
 5  bootmain
 6  buf
 7  cat
 8  console
 9  defs
10  echo

第二个像：

(b.txt)
 bio cat BIO bootasm
 bio defs cat
 Bio console 
 bio BiO
 bIo assert
 bootasm asm
 bootasm echo
 bootasm console
 bootmain buf
 bootmain bio
 bootmain bootmain
 bootmain defs
 cat cat
 cat assert
 cat assert

我们希望输出如下：

我们读取第一个文件中每个文件中的每个第二列,我们搜索它是否存在于第二个文件中每行的每一列中,如果是,我们将其替换为第一个文件中第一列中的数字.我只是在第一列中做到了,我不能为其余部分做到这一点.

这是我使用的命令
awk’NR == FNR {a [$2] = $1; next} {$1 = a [$1];} 1’a.txt b.txt

3 cat bio bootasm
3 defs cat
3 console
3 bio
3 assert
4 asm
4 echo
4 console
5 buf
5 bio
5 bootmain
5 defs
7 cat
7 assert
7 assert

我该怎么做其他专栏？

谢谢

解决方法

awk 'NR==FNR{h[$2]=$1;next} {for (i=1; i<=NF;i++) $i=h[$i];}1' a.txt b.txt

NR是所有文件的全局记录号(默认行号). FNR是当前文件的行号. NR == FNR块指定当全局行号等于当前数时要采取的动作,这仅对第一个文件是真的,即a.txt.此块中的下一个语句会跳过其余代码,因此for循环仅可用于第二个文件e.i.,b.txt.

首先,我们处理第一个文件,以便将单词id存储在一个关联数组中：NR == FNR {h [$2] = $1; next}.之后,我们可以使用这些ID来映射第二个文件中的单词. for循环(for(i = 1; i< = NF; i)$i = h [$i];)遍历所有列并将每列设置为数字而不是字符串,因此$i = h [$我实际上用其id替换了第i列的单词.最后,脚本末尾的1会导致所有行都被打印出来. 生产：

要使脚本不区分大小写,请将tolower调用添加到数组索引中：

awk 'NR==FNR{h[tolower($2)]=$1;next} {for (i=1; i<=NF;i++) $i=h[tolower($i)];}1' a.txt b.txt

（编辑：李大同）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!