加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 综合聚焦 > 服务器 > Linux > 正文

如何从文件linux中找到独特的单词

发布时间:2020-12-14 01:05:20 所属栏目:Linux 来源:网络整理
导读:我有一个大文件,线条看起来像这样 文本数字等[人 – (一些数字)]很多这个人 – 有些人在几行中重复,我想只计算独特的芒词.我不能使用唯一文件,因为Man字之前的文字在每一行总是不同的. 我怎样才能算出文件中唯一的Man-somenumbers单词? 解决方法 如果我明白
我有一个大文件,线条看起来像这样
文本数字等[人 – (一些数字)]很多这个人 – 有些人在几行中重复,我想只计算独特的芒词.我不能使用唯一文件,因为Man字之前的文字在每一行总是不同的.
我怎样才能算出文件中唯一的Man-somenumbers单词?

解决方法

如果我明白你想要做什么,那么

grep -oE 'Man-[0-9]+' filename | sort | uniq -c

应该做的伎俩.它的工作原理如下:首先

grep -oE 'Man-[0-9]+' filename

隔离文件中与Man- [0-9]正则表达式匹配的所有单词.然后通过排序管理该列表以获得uniq所需的排序列表,然后通过uniq -c管道该排序列表以计算每个唯一的单词出现的频率.

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读