加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 综合聚焦 > 服务器 > 安全 > 正文

unix – grep -f最大模式数量?

发布时间:2020-12-15 18:59:33 所属栏目:安全 来源:网络整理
导读:我想在带有-f的文本文件上使用grep来匹配长列表(10,000)的模式.事实证明,grep不喜欢这个(谁知道?).一天之后,它没有产生任何东西.较小的列表几乎可以瞬间完成. 我以为我可能会把我的长列表分开并做几次.知道模式列表的最大长度是多少? 另外,我对unix很新.欢
我想在带有-f的文本文件上使用grep来匹配长列表(10,000)的模式.事实证明,grep不喜欢这个(谁知道?).一天之后,它没有产生任何东西.较小的列表几乎可以瞬间完成.

我以为我可能会把我的长列表分开并做几次.知道模式列表的最大长度是多少?

另外,我对unix很新.欢迎采用其他方法.模式列表或搜索术语位于纯文本文件中,每行一个.

谢谢大家的指导.

我和约有同样的问题.在900万行的文件中搜索400万个模式.好像这是RAM的问题.所以我得到了这个整洁的小工作,可能比分裂和加入慢,但它只需要这一行.
while read line; do grep $line fileToSearchIn;done < patternFile

我需要使用这个工作,因为-F标志不是那些大文件的解决方案……

编辑:对于大文件来说这似乎很慢.经过一些研究,我发现了’faSomeRecords’以及Kent NGS-editing-Tools的其他很棒的工具

我通过从550万条记录文件中提取200万个fasta-rec来自己尝试.约. 30秒..

干杯

编辑:direct download link

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读