加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 综合聚焦 > 服务器 > Linux > 正文

在AWK中,如何拆分与“记录”具有相同字符串的连续行?

发布时间:2020-12-13 23:54:06 所属栏目:Linux 来源:网络整理
导读:假设我有下面的文字. aaaaaaaaaaaaaabbbbbbbbbcccccccccccccdddddddddd 有没有办法修改文本如下. 1 aaaaaaa1 aaaaaaa2 bbb2 bbb2 bbb3 ccccccccccccc4 ddddd4 ddddd 解决方法 你可以在awk中使用这样的东西: $awk '{print ($0!=p?++i:i),$0;p=$0}' file1 aaa
假设我有下面的文字.

aaaaaaa
aaaaaaa
bbb
bbb
bbb
ccccccccccccc
ddddd
ddddd

有没有办法修改文本如下.

1 aaaaaaa
1 aaaaaaa
2 bbb
2 bbb
2 bbb
3 ccccccccccccc
4 ddddd
4 ddddd

解决方法

你可以在awk中使用这样的东西:

$awk '{print ($0!=p?++i:i),$0;p=$0}' file
1 aaaaaaa
1 aaaaaaa
2 bbb
2 bbb
2 bbb
3 ccccccccccccc
4 ddddd
4 ddddd

只要当前行与前一行不同,i就会递增. p保存前一行的值$0.

或者,如JID所示:

awk '$0!=p{p=$0;i++}{print i,$0}' file

当前行与p不同时,替换p并递增i.有关这两种方法的优缺点的讨论,请参阅the comments

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读