bash – 匹配两个文件的第一列中的值,并将匹配的行连接到新文件
发布时间:2020-12-15 22:28:49 所属栏目:安全 来源:网络整理
导读:我需要在file1.txt中找到第1列($1)中字符串的匹配项,并在file2.txt中找到第1列($1)中的字符串.然后我想加入新文件中匹配的行. cat file1.txt1050008 5.156725968 8.404038296 124.9198605 3.23E-21 2.33E-17 38.578657823310747 5.631470026 8.581936875 124
我需要在file1.txt中找到第1列($1)中字符串的匹配项,并在file2.txt中找到第1列($1)中的字符串.然后我想加入新文件中匹配的行.
cat file1.txt 1050008 5.156725968 8.404038296 124.9198605 3.23E-21 2.33E-17 38.57865782 3310747 5.631470026 8.581936875 124.6039122 3.34E-21 2.33E-17 38.55204806 5910451 4.900364671 8.455329195 124.5720603 3.35E-21 2.33E-17 38.54935989 730156 5.565210738 8.48792701 122.2168789 4.28E-21 2.33E-17 38.34773989 cat file2.txt 4230037 ILMN Controls ILMN_Controls ERCC-00071 ILMN_333646 ERCC-00071 ERCC-00071 1050008 ILMN Controls ILMN_Controls ERCC-00009 ILMN_333584 ERCC-00009 ERCC-00009 5260356 ILMN Controls ILMN_Controls ERCC-00053 ILMN_333628 ERCC-00053 ERCC-00053 3310747 ILMN Controls ILMN_Controls ERCC-00144 ILMN_333719 ERCC-00144 ERCC-00144 5910451 ILMN Controls ILMN_Controls ERCC-00003 ILMN_333578 ERCC-00003 ERCC-00003 1710435 ILMN Controls ILMN_Controls ERCC-00138 ILMN_333713 ERCC-00138 ERCC-00138 1400612 ILMN Controls ILMN_Controls ERCC-00084 ILMN_333659 ERCC-00084 ERCC-00084 730156 ILMN Controls ILMN_Controls ERCC-00017 ILMN_333592 ERCC-00017 ERCC-00017 我希望输出文件看起来像这样: out.txt 1050008 5.156725968 8.404038296 124.9198605 3.23E-21 2.33E-17 38.57865782 1050008 ILMN Controls ILMN_Controls ERCC-00009 ILMN_333584 ERCC-00009 ERCC-00009 3310747 5.631470026 8.581936875 124.6039122 3.34E-21 2.33E-17 38.55204806 3310747 ILMN Controls ILMN_Controls ERCC-00144 ILMN_333719 ERCC-00144 ERCC-00144 5910451 4.900364671 8.455329195 124.5720603 3.35E-21 2.33E-17 38.54935989 5910451 ILMN Controls ILMN_Controls ERCC-00003 ILMN_333578 ERCC-00003 ERCC-00003 730156 5.565210738 8.48792701 122.2168789 4.28E-21 2.33E-17 38.34773989 730156 ILMN Controls ILMN_Controls ERCC-00017 ILMN_333592 ERCC-00017 ERCC-00017 这些文件是制表符分隔的,并且在某些列中缺少值. file2.txt和> 47000行有31列,我试图在bash(OSX)中执行此操作 如果您有解决方案,我将非常感谢您能简单解释一下这些步骤,因为我对此非常陌生. 解决方法awk 'BEGIN { FS = OFS = "t" } NR == FNR { # while reading the 1st file # store its records in the array f f[$1] = $0 next } $1 in f { # when match is found # print all values print f[$1],$0 }' file1 file2 (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |