将null / blank列替换为上一个已知列(sed / awk / script)

时间:2013-08-18 01:15:29

标签: linux shell sed awk

有人可以帮我弄清楚如何用最后一个已知值替换空列。这是一行,我希望数字“0.7588044”替换此行中的空值:

0.7723808|0.767398|0.7645381|0.7605125|0.759718|0.7588044|0.7588044|0.7588044|0.7588044|0.7588044|0.7588044||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

换句话说,我希望“0.7588044”介于空/ null“|”之间行尾的分界线。

我无法弄清楚如何使用像sed这样的东西。任何帮助将不胜感激。

以下是我文件的前3行:

66943|0.9939215|0.9873032|0.9791299|0.9708792|0.9623731|0.9535987|0.945847|0.9379317|0.9286675|0.9203091|0.9127985|0.9041528|0.8966769|0.8902251|0.8832675|0.8778407|0.8734665|0.8679647|0.8616999|0.8560756|0.8518617|0.8463235|0.8410841|0.8342401|0.8311638|0.8261909|0.8252836|0.8218218|0.8177906|0.815474|0.8122096|0.8115648|0.8108233|0.8108233|0.8108233|0.8108233|0.8108233|0.8108233||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
69550|0.9946427|0.9888051|0.9815896|0.9742986|0.966774|0.9590039|0.9521323|0.9451087|0.9368793|0.9294462|0.9227601|0.9150554|0.9083862|0.9026252|0.896407|0.8915528|0.8876377|0.8827099|0.8770942|0.8720485|0.8682655|0.8632902|0.8585799|0.8524216|0.8496516|0.8451712|0.8443534|0.8412323|0.8375956|0.8355048|0.8325575|0.8319751|0.8313053|0.8313053|0.8313053|0.8313053|0.8313053|0.8313053||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
380713|0.9942899|0.9880703|0.9803859|0.9726248|0.9646193|0.9563567|0.9490533|0.941592|0.9328543|0.9249665|0.917875|0.9097072|0.9026409|0.8965395|0.8899569|0.8848204|0.8806788|0.8754678|0.8695317|0.8642001|0.8602043|0.8549507|0.8499787|0.8434811|0.8405594|0.8358352|0.834973|0.8316831|0.8278509|0.8256481|0.8225436|0.8219303|0.8212249|0.8212249|0.8212249|0.8212249|0.8212249|0.8212249||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

awk代码可以工作但只是第一行:

3 个答案:

答案 0 :(得分:5)

您可以使用以下awk脚本:

awk -F'|' 'BEGIN{OFS="|"}{for(i=1;i<NF;i++){if($i==""){$i=l}else{l=$i}}print}'

这种形式的可读性更好:

BEGIN {
    OFS="|" # set output field separator to |
}
{
    for(i=1;i<NF;i++) { # iterate through columns
        if($i=="") { # if current column is empty
            $i=l # use the last value
        } else {
            l=$i # else store the value
        }
    }
    print # print the line
}

答案 1 :(得分:1)

这可能适合你(GNU sed):

sed -r ':a;s/^(.*\|([^|]+)\|)\|/\1\2|/;ta' file

答案 2 :(得分:0)

解决方案的一些较短版本hek2mgl

awk '{for(i=1;i<NF;i++) $i=($i=="")?l:l=$i}1' FS=\| OFS=\| file