加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 综合聚焦 > 服务器 > 安全 > 正文

bash – BSD sed无法替换所有“,0”

发布时间:2020-12-16 01:57:41 所属栏目:安全 来源:网络整理
导读:我对GNU sed和BSD sed之间的区别有所了解.不幸的是我没有 linux机器,只有mac可用. 我有一个csv格式的大型数据文件,用逗号分隔.即使文件的前两行太大而无法在此处发布,您可以找到前两行here. 我需要用“NA”代替0,8,9,-999,-999.0的值,因为这些值是缺失值的代
我对GNU sed和BSD sed之间的区别有所了解.不幸的是我没有 linux机器,只有mac可用.

我有一个csv格式的大型数据文件,用逗号分隔.即使文件的前两行太大而无法在此处发布,您可以找到前两行here.

我需要用“NA”代替0,8,9,-999,-999.0的值,因为这些值是缺失值的代码.

我在bash提示符中使用了以下sed命令

sed -e 's/-999.??/NA/g' 
    -e 's/-999/NA/g' 
    -e 's/,/,NA,/g' 
    -e 's/,/g' 
    firsttwolines.csv

结果看起来很好,除了仍然存在一个0.如何修复它?以及如何将它放在bash脚本中?有没有更好的方法来完成这项任务?

解决方法

我认为awk对于这项任务来说是更好的选择(用gawk和nawk测试):

awk '{ for(i=1; i<=NF; i++) if($i == 0 || $i == 8 || $i == 9 || $i == -999) $i = "NA" } 1' FS=,OFS=,firsttwolines.csv

for循环遍历每个字段并测试它与NA列表的相等性,如果发现该字段被NA替换,请注意awk在测试之前将字段转换为数字.最后的1调用默认块{print $0}.

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读