Question

我最近一直在使用RPART并进行了一项我不理解的计算。

在处理信息获取时，如何计算“改进”或变量重要性（从我的测试看，它们似乎相同）。

作为一个虚拟的例子，我尝试学习下表：

   happy,class
   yes,p
   no,n

使用命令：

fit <-rpart(class ~ happy,data=train,parms = list(split="information"),minsplit=0)

这很简单，并返回带有根的预期树，然后每个叶子包含一个元素。

如果这让人感到困惑，那么拆分的改进是1.386294。

我希望这里的改进是1（从熵1到儿童的熵0），我错过了什么？

Answer 1

好吧，回答这个问题，这是因为RPART正在使用自然日志。

因此，似乎改进分数是由节点中元素数量缩放的熵的改进。

根节点中的熵是：-ln（1/2）* 1/2 * 2 + -ln（1/2）* 1/2 * 2 = -ln（1/2）* 2 1.38。叶节点中的熵都是0。

为什么他们使用自然日志，我不知道。