在字段中替换后输出awk中的字段分隔符

发布时间：2020-12-14 00:43:20 所属栏目：Linux 来源：网络整理

导读：在修改awk中的特定字段后,输出字段分隔符上的信息是否会丢失？如果有多个字段分隔符并且我希望它们被恢复会发生什么？例如,假设我有一个简单的文件示例,其中包含： a:e:i:o:u 如果我只是运行一个awk脚本,它考虑了输入字段分隔符,它会打印我文件中的每一行,

在修改awk中的特定字段后,输出字段分隔符上的信息是否会丢失？如果有多个字段分隔符并且我希望它们被恢复会发生什么？

例如,假设我有一个简单的文件示例,其中包含：

a:e:i:o:u

如果我只是运行一个awk脚本,它考虑了输入字段分隔符,它会打印我文件中的每一行,例如运行

awk -F: '{print $0}' example

我会看到原来的一行.但是,如果我直接修改其中一个字段,例如同

awk -F: '{$2=$2"!"; print $0}' example

我没有得到原始行的修改版本,而是看到由默认空格分隔符分隔的字段,即：

a e! i o u

我可以通过指定OFS来取回原始版本的修改版本,例如：

awk -F: 'BEGIN {OFS=":"} {$2=$2"!"; print $0}' example

但是,在这种情况下,有多个潜在的场分离器,但在多个分离器的情况下,是否有一种简单的方法来恢复原始分离器？

例如,如果示例同时具有：和;作为分隔符,我可以使用-F“：|;”处理文件但OFS不足以恢复原始分隔符的相对位置.

更明确地说,如果我们切换到包含的example2

a:e;i:o;u

我们可以使用

awk -F":|;" 'BEGIN {OFS=":"} {$2=$2"!"; print $0}' example2

(或-F“[：;]”)得到

a:e!:i:o:u

但是我们已经失去了：和;如果我们能够恢复,那将会得到维持

a:e!;i:o;u

解决方法

您需要使用GNU awk将第4个arg用于split(),这样可以保存分隔符,就像RT对RS一样：

$awk -F'[:;]' '{split($0,f,FS,s); $2=$2"!"; r=s[0]; for (i=1;i<=NF;i++) r=r $i s[i]; $0=r} 1' file
a:e!;i:o;u

没有自动填充的FS匹配字符串数组,因为每次将记录拆分为字段时,存储与FS匹配的字符串的时间和内存有多昂贵.相反,GNU awk人员为split()提供了第4个arg,这样你就可以在需要的时候自己动手.这是几年前在经验丰富的awk用户和gawk提供商之间的comp.lang.awk新闻组中进行长时间对话的结果,然后才同意这是最好的方法.

请参阅https://www.gnu.org/software/gawk/manual/gawk.html#String-Functions处的split().

（编辑：李大同）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!