python tsfresh-column_id参数用于什么

时间:2018-08-18 20:53:22

标签: python pandas feature-engineering

tsfresh需要在特定列中输入数据。我最初以为column_id只是row_index,但我担心这是错误的。

我有传感器数据-压力传感器,温度传感器和湿度传感器以10秒的间隔被捕获。因此,它是4列pandas DataFrame。现在告诉我如何使用数据?什么是column id

文档很好here,但我无法理解entity的含义。每个传感器测量的都是不同的东西,所有传感器都安装在机器单元中。

2 个答案:

答案 0 :(得分:0)

源代码对此密文有所说明:

tsfresh/feature_extraction/extraction.py:76

.dockerignore

因此,此列应为时间序列的所有点都具有相同的值。如果数据框中此列中有多个值,则lib会将其解释为多个时间序列,并同时分析所有时间序列。

答案 1 :(得分:0)

此列指示时间序列所属的实体。将为每个实体分别提取要素。生成的特征矩阵将每个实体包含一行。在文档中提出的示例中,您具有在不同时间的不同机器人的6个传感器的值。在此示例中,每个机器人都是不同的实体,因此每个机器人都有不同的ID。

或者,如果您具有不同供应商的数据,并且它们在不同的时间戳下以不同类别出售的商品数量,则可以将供应商ID用作您的“ column_id”。