Question

我想我在大熊猫中对群体的理解缺少了一些东西。我的Dataframe已在'Date'上编入索引，并且该框架有一个名为'Year'的列，其中2014-10-10是2014，等等。

关键是我想将第1年数据与第2年数据相关联，依此类推。我应该对索引值列表做些什么？

我的意见是：

Date    Adj Close   Year
2013-Dec-31 0.16    2013
2013-Dec-30 0.13    2013
2013-Dec-27 0.11    2013
2012-Dec-31 0.1     2012
2012-Dec-28 0.1     2012
2012-Dec-27 0.1     2012
2012-Dec-26 0.1     2012

要进行相关，它们必须是并排框架吗？

Date    Adj Close   Year    Date    Adj Close   Year
2012-Dec-31 0.1     2012    2013-Dec-31 0.16    2013
2012-Dec-28 0.1     2012    2013-Dec-30 0.13    2013
2012-Dec-27 0.1     2012    2013-Dec-27 0.11    2013

我是否必须为每个年度组创建一个新的数据框并合并它们？

Answer 1

没有合并要做。您的所有数据都是针对特定日期的，只是＆＃34; stack＆＃34;彼此背后的数据，然后确保按月，日分组以获得年度相关性（同一天）

只需确保你的索引是一个合适的时间序列，然后pandas将为你做所有的魔术。也就是说，请查看手册中的this和this。如果您的索引是时间序列，那么使用索引来加权/计算距离的任何函数都会自动为您正确执行此操作。

在这里，我将再次从documentation

为您绘制自相关图

df = pd.read_clipboard()
df.index = pd.DatetimeIndex(df.Date)
from pandas.tools.plotting import autocorrelation_plot
autocorrelation_plot(df['Adj')

，输出

Output

如果您想使用此索引应用其他过滤，您甚至可以使用df['2013']选择特定年份。

具有时间序列的统计汇总数据

1 个答案: