Groupby日期,重新格式化我的日期

时间:2015-06-22 10:47:50

标签: python pandas

我有一个包含多个日期的数据框,并针对每个日期进行计数。日期可以多次出现。我使用以下方法对数据进行分组以绘制时间序列:

timeseries = df[['date','count']].groupby(['date']).sum().reset_index()

这让我可以想象我需要什么,但是当我尝试使用以下方法查看确切的值时:

timeseries.sort('count', ascending=False)['count'][:5]

日期以索引方式打印:

Date    Count
1695    1529
1349    1013
1692     956
998      637
997      636
Name: count, dtype: int64

似乎我正在做一些基本错误的事情,导致我失去日期值并改为维持索引。

1 个答案:

答案 0 :(得分:0)

您的问题的解决方案要求您了解圆柱名称“日期”与名为“日期”的索引之间的区别。然后,您的对象类型的日期列,需要与datetime类似。

此外,您的日期列可能需要转换,请尝试使用http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.convert_objects.html

而且,您不需要在最后重置索引。