熊猫读取包含nan和null作为字符串的文件

时间:2019-06-11 14:39:05

标签: python pandas

我正在读取以制表符分隔的.txt文件作为熊猫数据框。在该文件中,我有如下条目:

user1   2013    02  12  10
nan 2013    02  12  10 
null    2013    03  05  6

我这样读文件:

with open('usernames_2013.txt', 'r') as f:
    df3 = pd.read_csv(f, sep='\t', header=None)
    df3.columns=["ID", "Year", "Month", "Day", "Hour"] 

我得到以下信息:

               ID  Year  Month  Day  Hour
170667  user1  2013      2   12    10
         ID  Year  Month  Day  Hour
170668  NaN  2013      2   12    10
         ID  Year  Month  Day  Hour
262842  NaN  2013      3    5     6

我使用以下代码获取了这些行:

print(payload3.loc[[170667]])
print(payload3.loc[[170668]])
print(payload3.loc[[262842]])

因此,user1在行170667中,nan在行170668中,null在行262842中。文件中有nan和null的多个实例,这只是一个示例。

我希望nannull都是有效的字符串;它们不应为NaN。我该怎么做?

0 个答案:

没有答案