Question

当我对数据框执行 dtypes.to_dict() 时，我得到了这个

{'Item ID': 'int64',
 'Unit': 'object',
 'Quantity': 'float64',
 'Amount': 'float64',
 'Invoice ID': 'object',
 'Invoice Date': 'object',
 'Legal Entity ID': 'int64',
 'Vendor ID': 'object',
 'Config ID': 'float64',
 'Size ID': 'float64',
 'Color ID': 'float64',
 'Style ID': 'float64',
 'Location ID': 'object'}

我想将所有 ID 列视为对象，因为我不希望它们弄乱描述输出。因此，我复制并粘贴它并手动编辑所有 ID 列作为对象，然后删除日期列并在 parse_dates 中使用 read_csv 参数。

我的问题：

除了我在 dtype=dtype_dict 中传递的对象之外，还有什么方法可以将对象指定为默认对象？
我想只指定 dtype=object 会使 read_csv 停止猜测数据类型。然后，如果我对特定列执行 astype，它可能会更有效 - 对吗？
我只有一个日期值，没有时间戳。因此，astype 不接受 date 或 datetime，而只接受 datetime64。知道为什么吗？
我的数据集很大。因此，哪种方法更好 - 先使用对象默认值读取然后设置数据类型或在读取后设置数据类型？

Pandas - 如何为除我指定的列之外的所有列指定默认数据类型？

0 个答案: