为NaN条目选择不同的值,以使用不同的列附加DataFrame

时间:2015-12-23 05:44:49

标签: python pandas dataframe

我正在连接多个月csv's,其中较新的,更新版本有其他列。因此,将它们全部放在一起会使用NaN填充某些列的某些行。

此行为的问题在于它将这些NaN与来自数据集的真空条目混合,这些条目需要易于区分。

我现在唯一的解决方案是用唯一的字符串替换原始的NaN,连接csv,用第二个唯一的字符串替换新的NaN,用NaN替换第一个唯一的字符串。

鉴于我正在处理的数据量,这是一个非常低效的解决方案。我认为有一些方法可以确定Panda DataFrame如何填写这些条目,但无法找到任何内容。

更新示例:

A B  
1 NaN  
2 3 

并追加

A B C  
1 2 3  

给予

A B C  
1 NaN NaN  
2 3 NaN  
1 2 3  

但我想要

A B C  
1 NaN 'predated'  
2 3 'predated'  
1 2 3  

1 个答案:

答案 0 :(得分:2)

如果您有一组核心列,如df1所示,您可以将.fillna()应用于核心集与最近{的任何新列之间的.difference() { {1}}。

DataFrames
相关问题