拆分列名称并根据列名称中的数据创建新列

时间:2019-03-16 08:59:06

标签: python pandas dataframe time-series

我的熊猫数据框中的传感器数据如下:

Timestamp           1014.temperature    1014.humidity   1015.temperature    1015.humidity   1016.temperature    1016.humidity
2017-10-01 00:00:00 11.396667           92.440806       10.513333      92.204295            11.040000            92.959605  

SensorID由每列中点之前的4位数字给出。 Timestamp为数据建立索引。数据将继续运行多个时间戳和SensorID。

我该怎么做以检索每一列中的SensorID来创建一个新列,以使我的数据框看起来像这样:

Timestamp            SensorID Temperature   Humidity
2017-10-01 00:00:00  1014     11.396667     92.440806
2017-10-01 00:00:00  1015     10.513333     92.204295
2017-10-01 00:00:00  1016     11.040000     92.959605

谢谢。

1 个答案:

答案 0 :(得分:5)

列中MultiIndex的第一个str.split并由第一级的DataFrame.stack重塑,最后DataFrame.reset_indexrename重塑:

#if Timestamp is column
#df = df.set_index('Timestamp')

df.columns = df.columns.str.split('.', expand=True)
df = df.stack(level=0).reset_index().rename(columns={'level_1':'SensorID'})
print (df)
             Timestamp SensorID   humidity  temperature
0  2017-10-01 00:00:00     1014  92.440806    11.396667
1  2017-10-01 00:00:00     1015  92.204295    10.513333
2  2017-10-01 00:00:00     1016  92.959605    11.040000