当我对数据框执行 dtypes.to_dict() 时,我得到了这个
{'Item ID': 'int64',
'Unit': 'object',
'Quantity': 'float64',
'Amount': 'float64',
'Invoice ID': 'object',
'Invoice Date': 'object',
'Legal Entity ID': 'int64',
'Vendor ID': 'object',
'Config ID': 'float64',
'Size ID': 'float64',
'Color ID': 'float64',
'Style ID': 'float64',
'Location ID': 'object'}
我想将所有 ID 列视为对象,因为我不希望它们弄乱描述输出。因此,我复制并粘贴它并手动编辑所有 ID 列作为对象,然后删除日期列并在 parse_dates
中使用 read_csv
参数。
我的问题:
dtype=dtype_dict
中传递的对象之外,还有什么方法可以将对象指定为默认对象?dtype=object
会使 read_csv 停止猜测数据类型。然后,如果我对特定列执行 astype,它可能会更有效 - 对吗?date
或 datetime
,而只接受 datetime64
。知道为什么吗?