随机化和填充数据集是什么意思?

时间:2019-03-27 06:46:11

标签: python machine-learning

我得到了一个不平衡的数据集,并被要求执行以下功能:1 /随机化数据2 /填充训练和验证数据。 这意味着要随机整理数据,然后将其分为训练和验证集?

2 个答案:

答案 0 :(得分:1)

是的,我要说的是问题要问你的。由于数据集不平衡,请确保分层(除非有理由不这样做,例如时间序列)。

答案 1 :(得分:1)

是的。这样做的主要目的是获得更多分层的培训和验证集。这是处理不平衡数据集的最简单方法。