评估没有标签的测试数据集! -是否可以评估?

时间:2019-01-17 07:00:10

标签: machine-learning

在机器学习中,我们知道在准备好部署模型时,应该使用测试数据设置。在此之前,我们使用训练数据集合训练模型,并将其分为 train validation 或交叉验证方法。在这里,每组都有相应的标签。

因此,通过从模型进行预测来评估或找到混淆矩阵非常简单。我们首先可以预测y_pred并将其与y_val进行比较。在这种情况下,如何获取没有标签的测试集的准确性或衡量其性能。而且我知道,它不应该设置标签。

但是,如何测量此测试集的性能?还是仅通过使用训练集来确保模型的性能?听起来像是一个愚蠢的问题,但是对我的快速建议或纠正非常赞赏。谢谢。

1 个答案:

答案 0 :(得分:1)

您不能。基本上,您有两个选择:手动标记测试数据(可能只是一部分),或者信任训练准确性,并可能将其降低10%。我建议第一种方法。