如何使用Python / Pandas从{Date}字段按月分组

时间:2017-07-04 19:38:35

标签: python pandas

我有一个数据帧df,如下所示:

| date      | Revenue | Cost |
|-----------|---------|------|
| 6/1/2017  | 100     | 20   |
| 5/21/2017 | 200     | 40   |
| 5/21/2017 | 300     | 60   |
| 6/20/2017 | 400     | 80   |
| 6/1/2017  | 500     | 100  |

我需要按月将上述数据分组,然后按天分组以获得输出:

| Month | Day | SUM(Revenue) | SUM(Cost) |
|-------|-----|--------------|-----------|
| May   | 21  | 500          | 100       |
| June  | 1   | 600          | 120       |
| June  | 20  | 400          | 80        |

我尝试了这段代码但是没有用:

df.groupby(month('date'), day('date')).agg({'Revenue': 'sum', 'Cost': 'sum' })

我想只使用Pandas或Numpy而不使用其他库

1 个答案:

答案 0 :(得分:4)

我们将set_indexsum与参数level一起使用:

df['date'] = pd.to_datetime(df['date'])
df['Month'] = df['date'].dt.strftime('%b')
df['Day'] = df['date'].dt.day   
df.set_index(['Month','Day']).sum(level=[0,1]).reset_index()

输出:

  Month  Day  Revenue  Cost
0   Jun    1      600   120
1   Jun   20      400    80
2   May   21      500   100