将CSV文件读入pandas DataFrame,并从多列构建日期时间索引

时间:2013-09-23 21:42:14

标签: python numpy pandas

我有一个像这样的CSV文件:

2011    1   10  1000000
2011    1   11  998785
2011    1   12  1002940
2011    1   13  1004815
2011    1   14  1009415
2011    1   18  1011935

我希望将其读入DataFrame对象,并使用frist 3 colomns构建日期时间类型索引。最终的DataFrame应如下所示:

                     values
datetime(2011,1,10)  1000000
datetime(2011,1,11)  998785
...

我该怎么做?非常感谢!

1 个答案:

答案 0 :(得分:3)

import io
import pandas as pd
content = io.BytesIO('''\
2011    1   10  1000000
2011    1   11  998785
2011    1   12  1002940
2011    1   13  1004815
2011    1   14  1009415
2011    1   18  1011935''')

df = pd.read_table(content, sep='\s+', parse_dates=[[0,1,2]], header=None)
df.columns=['date', 'values']
print(df)

产量

                 date   values
0 2011-01-10 00:00:00  1000000
1 2011-01-11 00:00:00   998785
2 2011-01-12 00:00:00  1002940
3 2011-01-13 00:00:00  1004815
4 2011-01-14 00:00:00  1009415
5 2011-01-18 00:00:00  1011935
相关问题