Pandas 操作将 dtype: timedelta64[ns] 更改为 dtype: object

时间:2021-05-20 14:51:58

标签: python pandas

我正在计算 Pandas 数据框中的时间差,以便我可以对这些时间差求和。这是我执行此操作的完整代码:

temp['ACCESS_TIME'] = pd.to_datetime(temp['ACCESS_TIME'])
temp = temp.sort_values(['ID','ACCESS_TIME'])

temp['TIME_DIFFERENCE'] =  temp.groupby(['ID'])['ACCESS_TIME'].diff()

oneMin = temp.copy()

oneMin.loc[(oneMin.TIME_DIFFERENCE > '00:01:00'), 'TIME_DIFFERENCE'] = '00:01:00'
oneMin['DURATION'] = oneMin.groupby(['ID'])['TIME_DIFFERENCE'].transform('sum')

在第三行之后,一个简单的“temp['TIME_DIFFERENCE']”显示了数据类型:timedelta64[ns]。但是在第 5 行之后,打印 "oneMin['TIME_DIFFERENCE']" 显示 dtype: object。这会在尝试第 6 行时导致错误,其中指出:“+ 不支持的操作数类型:‘int’和‘Timedelta’”。我真的不知道发生了什么。

问题是我想将时差限制在 1 分钟。在我用这条线消除 1 分钟的时差之前:

oneMin = oneMin[oneMin['TIME_DIFFERENCE'] < '00:01:00']

这完全没问题。但我不想在一分钟内删除这些值,我想在一分钟内限制它们。

1 个答案:

答案 0 :(得分:0)

问题是您将“TIME_DIFFERENCE”列的某些值设置为字符串“00:01:00”。您可能想要做的是将代码中的第五行替换为

oneMin.loc[(oneMin.TIME_DIFFERENCE > '00:01:00'), 'TIME_DIFFERENCE'] = pd.Timedelta('00:01:00')
相关问题