随机森林中的循环序数特征

时间:2017-11-17 12:22:57

标签: machine-learning random-forest feature-engineering

如何为随机森林算法准备一天或一周中的时间循环序数特征?

通过在午夜之后用分钟编码时间,23:55和00:05之间的信息差异将非常高,尽管差异只有10分钟。

我找到了一个解决方案here,其中时间特征使用余弦特征后秒的余弦和正弦分为两个特征。但那适合随机森林吗?使用随机森林时,无法确保每次拆分都会出现所有要素。因此,决策中通常会有一半的时间信息丢失。

期待你的想法!

0 个答案:

没有答案