bash – 匹配单词列表中的单词并计算出现次数
发布时间:2020-12-15 22:09:11 所属栏目:安全 来源:网络整理
导读:所以我有一个普通的文本文件,其中有一些写作,它实际上是随机的,但我也有一个单词列表,我想与它进行比较,并计算出现在单词列表上的文本文件中的每个单词的出现次数. 例如,我的单词列表可以由以下内容组成: goodbad cupidbananaapple 然后我想将这些单词中的
所以我有一个普通的文本文件,其中有一些写作,它实际上是随机的,但我也有一个单词列表,我想与它进行比较,并计算出现在单词列表上的文本文件中的每个单词的出现次数.
例如,我的单词列表可以由以下内容组成: good bad cupid banana apple 然后我想将这些单词中的每一个与我的文本文件进行比较,这可能是这样的: 有时我会前往好的地方,而不是坏的地方.例如,我想去天堂,遇到一个吃苹果的丘比特.也许我会看到神话中的生物吃其他水果,如苹果,香蕉和其他好水果. 我希望我的输出能够生成列出的单词每次出现的次数.我有办法做到这一点是awk和for循环但我真的希望避免for循环因为它将需要永远,因为我的真实单词列表大约10000字长. 所以在这种情况下,我的输出应该是(我认为)9,因为它计算该列表上一个单词的总出现次数. 顺便说一句,该段是完全随机的. 解决方法
对于任何更大的文本,我肯定会使用这个:
perl -nE'BEGIN{open my$fh,"<",shift;my@a=map lc,map/(w+)/g,<$fh>;@h{@a}=(0)x@a;close$fh}exists$h{$_}and$h{$_}++for map lc,/(w+)/g}{for(keys%h){say"$_: $h{$_}";$s+=$h{$_}}say"Total: $s"' word.list input.txt (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |