bash – grep -vf对大文件来说太慢了

发布时间：2020-12-15 21:35:36 所属栏目：安全来源：网络整理

导读：我正在尝试使用存储在文件filter.txt中的模式从data.txt过滤数据.如下, grep -v -f filter.txt data.txt op.txt 对于filter.txt中的30-40K行和data.txt中的~300K行,这个grep需要10-15分钟. 有没有办法加快这个？ data.txt中 data1data2data3 filter.txt data

我正在尝试使用存储在文件filter.txt中的模式从data.txt过滤数据.如下,

grep -v -f filter.txt data.txt > op.txt

对于filter.txt中的30-40K行和data.txt中的~300K行,这个grep需要10-15分钟.

有没有办法加快这个？

data.txt中

data1
data2
data3

filter.txt

data1

op.txt

data2
data3

这适用于codeforester提供的解决方案,但是当filter.txt为空时失败.

解决方法

根据 related帖子中的 Inian’s解决方案,这个awk命令可以解决您的问题：

awk 'FNR==NR {hash[$0]; next} !($0 in hash)' filter.txt data.txt > op.txt

（编辑：李大同）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!