perl删除文件中的重复行
发布时间:2020-12-16 00:10:20 所属栏目:大数据 来源:网络整理
导读:perl删除文件中的重复行???????????? 2011-09-28 19:59:57 ?????????? 分类: Python/Ruby 如果有一个文件data有10G大,但是有好多行都是重复的,需要将该文件中重复的行合并为一行,那么我们需要用什么办法来实现 cat data |sort|uniq new_data #该方法可以
perl删除文件中的重复行????????????
2011-09-28 19:59:57??????????
分类: Python/Ruby
如果有一个文件data有10G大,但是有好多行都是重复的,需要将该文件中重复的行合并为一行,那么我们需要用什么办法来实现
cat data |sort|uniq > new_data #该方法可以实现,但是你需要花上好几个小时。结果才能出来。 下面是一个使用perl脚本来完成此功能的小工具。原理很简单,创建一个hash,每行的内容为键,值由每行出现的次数来填充,脚本如下;
(编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |