在电子商务数据集python上计算会话持续时间

时间:2020-01-27 10:37:09

标签: python pandas dataframe

我在python pandas中处理电子商务数据集,如下所示:

Timestamp                 
2019-10-23 08:18:14 UTC     
2019-10-23 08:18:17 UTC     
2019-10-23 08:18:27 UTC     
2019-10-15 04:09:18 UTC     
2019-10-15 04:10:14 UTC 

SessionId
1
1
1
2
2  

我想计算每个会话的持续时间,并使用该信息创建一个新的数据框。 我该怎么用熊猫呢?

1 个答案:

答案 0 :(得分:1)

以下是您如何执行此操作的示例:

import pandas as pd

# dummy data
df = pd.DataFrame({
    'Timestamp': ['2019-10-23 08:18:14', ' 2019-10-23 08:18:17', ' 2019-10-23 08:18:27', ' 2019-10-15 04:09:18', ' 2019-10-15 04:10:14'],
    'SessionId': [1, 1, 1, 2, 2]
})
df.Timestamp = pd.to_datetime(df.Timestamp)  # ensure timestamps are actual datetime objects

df.groupby('SessionId')['Timestamp'].agg(lambda x: max(x) - min(x)).to_frame().rename(columns={'Timestamp': 'Duration'})

作为以后任何问题的提示:展示您尝试解决问题的方法,否则人们可能会认为您只是懒惰,会否决您的问题;)

相关问题