Question

我有一个包含每日数据的.csv文件，如下所示：

some 19 more header rows
Werte
01.01.1971 07:00:00   ;     0.0
02.01.1971 07:00:00   ;     1.2
...and so on

我导入的

：

RainD=pd.read_csv('filename.csv',skiprows=20,sep=';',dayfirst=True,parse_dates=True)

结果，我得到了

In [416]: RainD
Out[416]: 
<class 'pandas.core.frame.DataFrame'>
DatetimeIndex: 14976 entries, 1971-01-01 07:00:00 to 2012-01-01 07:00:00
Data columns:
Werte:    14976  non-null values
dtypes: object(1)

所以它是一个数据帧，但也许时间序列可能是正确的方式？但是如何导入呢？ pandas文档列出了dtype中的read_csv选项，但没有关于我可以/应该指定的内容的信息。

但另一方面，DatetimeIndex:在我看来，大熊猫非常清楚我在这里处理日期，但仍然使它成为一个数据帧。为此，RainD['1971']之类的内容只会导致u'no item named 1971'密钥错误。

我觉得我只是遗漏了一些非常明显的东西，因为时间序列分析似乎就是熊猫所做的事情。

我的另一个想法是，大熊猫可能会被日期写成正确的（即dd.mm.yyyy;））方式而感到困惑，但是{{1}告诉我，我可以消化那么好。

此致 JC

Answer 1

EdChum＆＃39; df[df.index.year == 1971]解决了我的问题。

我可能还有其他一些问题（即熊猫的过期版本），但就目前而言，我可以继续工作。

使用pandas / python从导入的CSV中选择日期

1 个答案: