Question

当我使用

创建

[
    {'uid': '12345', 'name': 'John Smith', 'val1': '25', 'val2': '65'},
    {'uid': '56789', 'name': 'Joe Brown', 'val1': '1', 'val2': '2'}
]

时

DataFrame

电子表格中的

空白单元格用字符串pd.read_excel(my_excel_file, dtype=str)替换。另一方面，从

生成的nan

DataFrame

用pd.read_csv(my_csv_file, dtype=str)对象代替空白。为什么会这样？

Answer 1

您可以为ls(name = "package:base")指定一个na_values属性。

read_excel

Answer 2

我将尝试在这是为什么？上回答您的问题。当使用dtype=str来使用pd.read_excel读取Excel文件时，获得的结果与以下内容不一致您在使用pd.read_csv时会得到。主要原因或可以说，使用numpy.nan时用pd.read_csv对象替换空白单元格的优势在于，它可以帮助您使用pd.isna，该方法仅适用于numpy.nan对象，而不仅仅是nan。

与此相关的讨论很多，可以说，此功能又可以在pd.read_csv和pd.read_excel之间保持一致性。您可以在Github熊猫页面上详细了解讨论内容，read_excel with dtype=str converts empty cells to the string 'nan' #20377

对此进行了一些辩论

pd.read_excel（）用`nan`字符串替换空格，pd.read_csv（）使用numpy.nan

2 个答案: