使用Multiindex列切片数据

时间:2019-07-03 14:03:07

标签: python pandas dataframe

我有一个带有MultiIndex列的数据框。我想使用数据集的列过滤数据。当我尝试df.columns时,会收到以下信息:

MultiIndex(levels=[['power'], ['active']],
           codes=[[0], [0]],
           names=['physical_quantity', 'type'])

数据集的简短描述是:

physical_quantity          power
type                      active
2011-04-18 09:22:13-04:00    6.0
2011-04-18 09:22:16-04:00    6.0
2011-04-18 09:22:20-04:00    6.0
2011-04-18 09:22:23-04:00    6.0
2011-04-18 09:22:26-04:00    6.0

我发现的第一件事是,尽管在那里看到两列,但数据框确实说它是[529757 rows x 1 columns]的数据集。

我想要做的是选择一个时间间隔来过滤数据,选择称为 physical_quantity type 第一列

另一方面,第一列 physical_quantity类型)的数据未知:

physical_quantity  type  
power              active    float32
dtype: object

通过df.index进行检查,我设法看到了有关数据框的以下信息:

DatetimeIndex(['2011-04-18 09:22:13-04:00', '2011-04-18 09:22:16-04:00',
               '2011-04-18 09:22:20-04:00', '2011-04-18 09:22:23-04:00',
               '2011-04-18 09:22:26-04:00', '2011-04-18 09:22:30-04:00',
               '2011-04-18 09:22:33-04:00', '2011-04-18 09:22:37-04:00',
               '2011-04-18 09:22:40-04:00', '2011-04-18 09:22:44-04:00',
               ...
               '2011-05-14 23:59:26-04:00', '2011-05-14 23:59:29-04:00',
               '2011-05-14 23:59:33-04:00', '2011-05-14 23:59:36-04:00',
               '2011-05-14 23:59:40-04:00', '2011-05-14 23:59:43-04:00',
               '2011-05-14 23:59:46-04:00', '2011-05-14 23:59:50-04:00',
               '2011-05-14 23:59:53-04:00', '2011-05-14 23:59:57-04:00'],
              dtype='datetime64[ns, US/Eastern]', length=529757, freq=None)

因此我了解到该的数据类似于dtype='datetime64[ns, US/Eastern]

所以我的目标是从特定的日期和时间到另一天的时间对数据进行切片。

从2011-05-10 19:44:51-04:00到2011-05-10 23:17:59-04:00

我试图做这样的事情:

df[df['physical_quantity', 'type']] > 2011-05-10 19:44:51-04:00 
& 
df[df['physical_quantity', 'type']] < 2011-05-10 23:17:59-04:00
df[df['physical_quantity', 'type']] > 2011-05-10 19:44:51-04:00

File "<ipython-input-133-27848c7d6afc>", line 1
    df[df['physical_quantity', 'type']] > 2011-05-10 19:44:51-04:00
                                                ^
SyntaxError: invalid token

我该如何解决我的问题?

1 个答案:

答案 0 :(得分:0)

尝试

sorted