时间序列数据库

时间:2013-06-12 11:58:23

标签: time-series

我正在寻找perl,python甚至LISP中的开源库来处理时间序列数据。数据将从CSV文件中读取:数据运行长度通常为两年每10分钟。任何人都可以推荐一个允许我将数据加载到对象中的库,例如,从数据集中“排除13:00到19:00之间的所有星期日”,或者方便地创建一个包含我想要排除的所有句点的对象。对原始数据集的AND操作。每个时间样本必须能够处理多个值集。

我见过蟒蛇的大熊猫,它看起来很有前途,还有其他人想到了吗?

1 个答案:

答案 0 :(得分:2)

熊猫当然是一个很好的方式。 R语言也对时间序列有很好的支持。

from pandas import Series, date_range
from numpy.random import randn
rng = date_range('1/1/2011', periods=10000, freq='10min')
ts = Series(randn(len(rng)), index=rng)

filtered_index = rng[((rng.dayofweek!=6) | ((rng.hour < 13) | (rng.hour>=19)))]
no_sunday_afternoons = ts[filtered_index]
print no_sunday_afternoons['2011-01-02 12:30:00':'2011-01-02 19:30:00']


2011-01-02 12:30:00   -1.395918
2011-01-02 12:40:00    0.382604
2011-01-02 12:50:00   -0.422495
2011-01-02 19:00:00   -0.341497
2011-01-02 19:10:00    0.982950
2011-01-02 19:20:00   -0.909796
2011-01-02 19:30:00    0.842446
dtype: float64