如何在python中替换空字符串

时间:2016-01-11 11:52:09

标签: python csv numpy

我有一个csv文件,我将其读入数组,原始csv是一个带有空元素的5行,8列文件

       1  2         3        4    5    6   7         8     
Row 1:   '1 1'     '4 4'                  '2 2'   
Row 2:   '3'       '3'                    '3' 
Row 3:   '1 1 1 1' '1 1 1 1'              '2 2 2 2'
Row 4:   '2'       '4'                    '2' 
Row 5:   '4'       '4'                               '4'

我把它读到我的代码中:

[[nan '1 1' '4 4' nan nan nan '2 2' nan]
 [nan '3' '3' nan nan nan '3' nan]
 [nan '1 1 1 1' '1 1 1 1' nan nan nan '2 2 2 2' nan]
 [nan '2' '4' nan nan nan '2' nan]
 [nan '4' '4' nan nan nan nan '4']]

所以我想要的是将所有空元素替换为与-1相同数量的其他元素:

[['-1 -1' '1 1' '4 4' '-1 -1' '-1 -1' '-1 -1' '2 2' '-1 -1']
 ['-1' '3' '3' '-1' '-1' '-1' '3' '-1']
 ['-1 -1 -1 -1' '1 1 1 1' '1 1 1 1' '-1 -1 -1 -1' '-1 -1 -1 -1' '-1 -1 -1 -1' '2 2 2 2' '-1 -1 -1 -1']
 ['-1' '2' '4' '-1' '-1' '-1' '2' '-1']
 ['-1' '4' '4' '-1' '-1' '-1' '-1' '4']]

当我使用re.match("\d",element)时,我无法得到结果。那么有人可以帮忙吗?

3 个答案:

答案 0 :(得分:1)

怎么样:

for line in csvdata:
    multiplicity = max([len(datum.split(" ")) if isinstance(datum, str) else 0 for datum in line])
    for datum in line:
        if(not isinstance(datum, str)):
            datum = " ".join(["-1"]*multiplicity)

对我来说看起来很糟糕,但它应该有效。

答案 1 :(得分:0)

试试这个:

xs=[["nan '1 1' '4 4' nan nan nan '2 2' nan"],
    ["nan '3' '3' nan nan nan '3' nan"],
    ["nan '1 1 1 1' '1 1 1 1' nan nan nan '2 2 2 2' nan"],
    ["nan '2' '4' nan nan nan '2' nan"],
    ["nan '4' '4' nan nan nan nan '4'"]]

for x in xs:
   s = len(x[0].replace('nan','').replace(' ','').split("''")[0])-1
   r = ' '.join('v'*s).replace('v', '-1')
   r = "'%s'" % r
   x[0] = x[0].replace('nan', r)

答案 2 :(得分:0)

我相信你应该在你的问题中明确你正在使用一个库(numPy)。大多数解决方案都适用于Python,但由于您已经使用numpy,这是一个更好的解决方案我相信

x = np.asarray(pd.read_csv("data/org8.csv"))
x[np.isnan(x)] = -1