为什么在训练MLP时,categorical_accuracy是低的?

时间:2018-04-11 15:34:53

标签: python-3.x machine-learning keras artificial-intelligence data-science

我正在训练keras中的3层MLP。数据集严重失衡,并希望提高模型的可检测率。

每当我将目标/自变量编码为数字(即从字符串映射到数字)时,categorical_category得分接近0.37。使用category_optimizer。

当我将目标/自变量更改为分类(即一个热编码)时,报告的分数高达0.90。

然而,少数族裔(和最重要的班级)之一没有正确分类或根本没有。

我正在深入研究召回得分而不是精确度。

采用的其他技术:班级权重和对少数民族的上采样。

我发现在没有单个编码的目标变量的情况下工作更容易。

总共5个班级(1个班级代表大多数,4个班级代表异常,属于少数班级)

1 个答案:

答案 0 :(得分:0)

需要在所有分类问题中使用单热编码,否则你暗示你的类的数字结构和顺序就不存在(即数字 2更接近于1而不是4,但 class 2到1和4的情况并非如此。您仍然可以重新采样数据或使用每类加权来提高对精度的调用。

相关问题