加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 综合聚焦 > 服务器 > Linux > 正文

具有特定比例的随机拆分文件

发布时间:2020-12-14 01:23:14 所属栏目:Linux 来源:网络整理
导读:我想随机80/20使用awk拆分文件. 我已经阅读并尝试了找到HERE的选项,其中提出了以下内容: $awk -v N=`cat FILE | wc -l` 'rand()3000/N' FILE 如果你想随机选择,效果很好. 但是,是否可以更改此awk以将一个文件拆分为两个80/20(或任何其他)比例的文件? 解决
我想随机80/20使用awk拆分文件.

我已经阅读并尝试了找到HERE的选项,其中提出了以下内容:

$awk -v N=`cat FILE | wc -l` 'rand()<3000/N' FILE

如果你想随机选择,效果很好.

但是,是否可以更改此awk以将一个文件拆分为两个80/20(或任何其他)比例的文件?

解决方法

随着gawk,你会写

gawk '
    BEGIN {srand()}
    {f = FILENAME (rand() <= 0.8 ? ".80" : ".20"); print > f}
' file

例:

seq 100 > 100.txt
gawk 'BEGIN {srand()} {f = FILENAME (rand() <= 0.8 ? ".80" : ".20"); print > f}' 100.txt
wc -l 100.txt*
100 100.txt
 23 100.txt.20
 77 100.txt.80
200 total

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读