Pandas - 如何为除我指定的列之外的所有列指定默认数据类型?

时间:2021-03-09 10:29:20

标签: pandas

当我对数据框执行 dtypes.to_dict() 时,我得到了这个

{'Item ID': 'int64',
 'Unit': 'object',
 'Quantity': 'float64',
 'Amount': 'float64',
 'Invoice ID': 'object',
 'Invoice Date': 'object',
 'Legal Entity ID': 'int64',
 'Vendor ID': 'object',
 'Config ID': 'float64',
 'Size ID': 'float64',
 'Color ID': 'float64',
 'Style ID': 'float64',
 'Location ID': 'object'}

我想将所有 ID 列视为对象,因为我不希望它们弄乱描述输出。因此,我复制并粘贴它并手动编辑所有 ID 列作为对象,然后删除日期列并在 parse_dates 中使用 read_csv 参数。

我的问题:

  1. 除了我在 dtype=dtype_dict 中传递的对象之外,还有什么方法可以将对象指定为默认对象?
  2. 我想只指定 dtype=object 会使 read_csv 停止猜测数据类型。然后,如果我对特定列执行 astype,它可能会更有效 - 对吗?
  3. 我只有一个日期值,没有时间戳。因此,astype 不接受 datedatetime,而只接受 datetime64。知道为什么吗?
  4. 我的数据集很大。因此,哪种方法更好 - 先使用对象默认值读取然后设置数据类型或在读取后设置数据类型?

0 个答案:

没有答案
相关问题