使用pandas / python从导入的CSV中选择日期

时间:2015-01-19 13:24:27

标签: python csv pandas

我有一个包含每日数据的.csv文件,如下所示:

some 19 more header rows
Werte
01.01.1971 07:00:00   ;     0.0
02.01.1971 07:00:00   ;     1.2
...and so on
我导入的

RainD=pd.read_csv('filename.csv',skiprows=20,sep=';',dayfirst=True,parse_dates=True)

结果,我得到了

In [416]: RainD
Out[416]: 
<class 'pandas.core.frame.DataFrame'>
DatetimeIndex: 14976 entries, 1971-01-01 07:00:00 to 2012-01-01 07:00:00
Data columns:
Werte:    14976  non-null values
dtypes: object(1)

所以它是一个数据帧,但也许时间序列可能是正确的方式?但是如何导入呢? pandas文档列出了dtype中的read_csv选项,但没有关于我可以/应该指定的内容的信息。

但另一方面,DatetimeIndex:在我看来,大熊猫非常清楚我在这里处理日期,但仍然使它成为一个数据帧。为此,RainD['1971']之类的内容只会导致u'no item named 1971'密钥错误。

我觉得我只是遗漏了一些非常明显的东西,因为时间序列分析似乎就是熊猫所做的事情。

我的另一个想法是,大熊猫可能会被日期写成正确的(即dd.mm.yyyy;))方式而感到困惑,但是{{1}告诉我,我可以消化那么好。

此致 JC

1 个答案:

答案 0 :(得分:1)

EdChum&#39; df[df.index.year == 1971]解决了我的问题。

我可能还有其他一些问题(即熊猫的过期版本),但就目前而言,我可以继续工作。