重新采样不会将我的索引识别为日期时间

时间:2015-05-22 14:36:25

标签: datetime pandas

我使用的是datetime.date字段作为索引,但由于某种原因它似乎并不同意它是日期时间。

首先,我将确认该字段确实是datetime.date格式:

In [1]: df[date][0]

Out [1]: datetime.date(2010, 1, 1)

现在我尝试按周重新采样并绘制平均值:

In [2]: df.set_index(date)[var].resample('W', how='mean').plot()

/python2.7/site-packages/pandas/core/generic.pyc in resample(self, rule, how, axis, fill_method, closed, label, convention, kind, loffset, limit, base)
   2878                               fill_method=fill_method,    convention=convention,
   2879                               limit=limit, base=base)
-> 2880         return sampler.resample(self).__finalize__(self)
   2881 
   2882     def first(self, offset):

/python2.7/site-packages/pandas/tseries/resample.pyc in resample(self, obj)
    100             return self.obj
    101         else:  # pragma: no cover
--> 102             raise TypeError('Only valid with DatetimeIndex or PeriodIndex')
    103 
    104         rs_axis = rs._get_axis(self.axis)

TypeError: Only valid with DatetimeIndex or PeriodIndex

我无法提供样本数据,因为它是专有的。关于这里可能会发生什么的任何想法?

1 个答案:

答案 0 :(得分:0)

我认为您希望首先将日期列转换为pandas时间序列。 试试:

df['date'] = pd.to_datetime(df.date)
df.set_index('date')[var]....
pandas dev告诉我,大熊猫指数中的datetime个对象在可能的情况下应该避免效率低下。