bash – 匹配单词列表中的单词并计算出现次数

发布时间：2020-12-15 22:09:11 所属栏目：安全来源：网络整理

导读：所以我有一个普通的文本文件,其中有一些写作,它实际上是随机的,但我也有一个单词列表,我想与它进行比较,并计算出现在单词列表上的文本文件中的每个单词的出现次数. 例如,我的单词列表可以由以下内容组成： goodbad cupidbananaapple 然后我想将这些单词中的

所以我有一个普通的文本文件,其中有一些写作,它实际上是随机的,但我也有一个单词列表,我想与它进行比较,并计算出现在单词列表上的文本文件中的每个单词的出现次数.

例如,我的单词列表可以由以下内容组成：

good
bad 
cupid
banana
apple

然后我想将这些单词中的每一个与我的文本文件进行比较,这可能是这样的：

有时我会前往好的地方,而不是坏的地方.例如,我想去天堂,遇到一个吃苹果的丘比特.也许我会看到神话中的生物吃其他水果,如苹果,香蕉和其他好水果.

我希望我的输出能够生成列出的单词每次出现的次数.我有办法做到这一点是awk和for循环但我真的希望避免for循环因为它将需要永远,因为我的真实单词列表大约10000字长.

所以在这种情况下,我的输出应该是(我认为)9,因为它计算该列表上一个单词的总出现次数.

顺便说一句,该段是完全随机的.

解决方法

对于任何更大的文本,我肯定会使用这个：

perl -nE'BEGIN{open my$fh,"<",shift;my@a=map lc,map/(w+)/g,<$fh>;@h{@a}=(0)x@a;close$fh}exists$h{$_}and$h{$_}++for map lc,/(w+)/g}{for(keys%h){say"$_: $h{$_}";$s+=$h{$_}}say"Total: $s"' word.list input.txt

（编辑：李大同）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!