具有时间序列的统计汇总数据

时间:2014-10-13 16:19:31

标签: python datetime pandas

我想我在大熊猫中对群体的理解缺少了一些东西。我的Dataframe已在'Date'上编入索引,并且该框架有一个名为'Year'的列,其中2014-10-10是2014,等等。

关键是我想将第1年数据与第2年数据相关联,依此类推。我应该对索引值列表做些什么?

我的意见是:

Date    Adj Close   Year
2013-Dec-31 0.16    2013
2013-Dec-30 0.13    2013
2013-Dec-27 0.11    2013
2012-Dec-31 0.1     2012
2012-Dec-28 0.1     2012
2012-Dec-27 0.1     2012
2012-Dec-26 0.1     2012

要进行相关,它们必须是并排框架吗?

Date    Adj Close   Year    Date    Adj Close   Year
2012-Dec-31 0.1     2012    2013-Dec-31 0.16    2013
2012-Dec-28 0.1     2012    2013-Dec-30 0.13    2013
2012-Dec-27 0.1     2012    2013-Dec-27 0.11    2013

我是否必须为每个年度组创建一个新的数据框并合并它们?

1 个答案:

答案 0 :(得分:0)

没有合并要做。您的所有数据都是针对特定日期的,只是" stack"彼此背后的数据,然后确保按月,日分组以获得年度相关性(同一天)

只需确保你的索引是一个合适的时间序列,然后pandas将为你做所有的魔术。也就是说,请查看手册中的thisthis。如果您的索引是时间序列,那么使用索引来加权/计算距离的任何函数都会自动为您正确执行此操作。

在这里,我将再次从documentation

为您绘制自相关图
df = pd.read_clipboard()
df.index = pd.DatetimeIndex(df.Date)
from pandas.tools.plotting import autocorrelation_plot
autocorrelation_plot(df['Adj')

,输出

Output

如果您想使用此索引应用其他过滤,您甚至可以使用df['2013']选择特定年份。