Scikit-learn 1节点决策树?

时间:2016-11-13 01:09:24

标签: python numpy scikit-learn

我对这个问题感到有点困惑,我创建了一个列表列表(传递给numpy的asarray存储在X中),其中每个子列表都是样本的特征(每列中当前的值相同)因为我还没有将每个特征解析为整数)。然后通过numpy.fill创建我的y变量,并使用相同的值进行测试。我将这两个numpy数组传递给拟合(X,y),其中X =

array([[ 0,  1,  2, ..., -1, -1, -1],
   [ 0, -1,  2, ..., -1, -1, -1],
   [ 0, -1, -1, ..., -1, -1, -1],
   ..., 
   [ 0, -1, -1, ..., -1, -1, -1],
   [ 0, -1, -1, ..., -1, -1, -1],
   [ 0, -1,  2, ..., -1, -1, -1]])

和y =

[4 4 4 ..., 4 4 4]

然而,结果输出是1节点决策树,gini值为0.想知道是否有人可以解释为什么会发生这种情况。谢谢!

1 个答案:

答案 0 :(得分:1)

根据我的理解,所有样本的目标值都是4。我想树只有一个节点,它预测测试数据的目标值为4,因为所有训练数据的目标值都是4。并且gini index也是0,因为所有样本都在同一个类中。希望它有所帮助!