使用featuretools / DFS更新数据

时间:2018-03-10 17:46:54

标签: data-science featuretools

在ML 2.0和AI PM论文中,它意味着更新数据 - 可以是现有数据或新数据 - 动态(实时)发生。例如,它在AI PM论文中说,"相反,我们已经展示了一个在现实世界中工作的完整系统,不断更新实时数据。"

您的意思是更新数据会自动预处理到适当的特征向量中并包含在下一个模型重新训练周期中吗?或者,模型是动态更新的吗?

1 个答案:

答案 0 :(得分:2)

在这种情况下,数据更新意味着新数据会自动附加到现有数据,然后转换为新的特征向量。这些特征向量可用于使用现有模型重新训练模型或分数。

自动化是新数据的特征工程可能依赖于要计算的历史数据,因此Featuretools中的API旨在尽可能地从开发人员那里抽象出来。这是使用Entityset.concat(..)方法实现的。