如何在测试数据中应用Logistic回归模型

时间:2018-06-12 06:21:22

标签: logistic-regression

我有一个泰坦尼克号数据集,它有两个部分 - 训练数据和测试数据。 我在缺失值和异常值处理后开发了一个关于训练数据集的模型。

现在我必须在测试数据集上应用模型,因此在应用模型之前,我是否需要对此数据进行缺失值处理和异常值处理。 每当我必须预测时,它都会是同一个过程。

1 个答案:

答案 0 :(得分:0)

一切都取决于您尝试解决的方案。通常,我也尝试对测试数据应用数据预处理,这是因为我想比较两个模型的准确性(我希望它们相似)。但是为了以防万一,如果你想看到你的回归对异常值的表现,那么你可以尝试一下。

如果是预测数据,我认为您应该进行缺失值治疗,如果可能的话应该进行异常值处理。这是因为如果您可以将某些内容标记为异常值,那么您可以避免在模型上运行它们并获得奇怪的结果。但在大多数生产场景中,难以预测的是异常值,所以我通常不做异常值清理。

希望这有帮助!

相关问题