machine-learning - 评估没有标签的测试数据集！ -是否可以评估？

时间：2019-01-17 07:00:10

标签： machine-learning

在机器学习中，我们知道在准备好部署模型时，应该使用测试数据设置。在此之前，我们使用训练数据集合训练模型，并将其分为 train 和 validation 或交叉验证方法。在这里，每组都有相应的标签。

因此，通过从模型进行预测来评估或找到混淆矩阵非常简单。我们首先可以预测y_pred并将其与y_val进行比较。在这种情况下，如何获取没有标签的测试集的准确性或衡量其性能。而且我知道，它不应该设置标签。

但是，如何测量此测试集的性能？还是仅通过使用训练集来确保模型的性能？听起来像是一个愚蠢的问题，但是对我的快速建议或纠正非常赞赏。谢谢。

答案 0 :(得分：1)

您不能。基本上，您有两个选择：手动标记测试数据（可能只是一部分），或者信任训练准确性，并可能将其降低10％。我建议第一种方法。