Weka J48实现了不同的缺失值处理

时间:2014-06-25 10:31:19

标签: tree weka missing-data induction

我必须在使用缺失数据的一些任务中使用J48树归纳算法。现在我将做一些经验研究来比较J48树归纳的不同缺失值方法,以及不同的UCI训练数据集和这些数据集上的不同人工截肢率(标准,+ 10%,+ 40%截肢)。

我的主要问题是,我如何使用Weka J48类在J48源代码中实现以下方法,或者更好地在我自己的代码中实现。我可以将这种方法作为元分类器或其他方式处理吗? 方法我想测试作为J48标准处理和随机森林的对应物:

  • 删除缺少属性的对象(完整案例)
  • Hot-Deck-Methods(寻找概念内部捐赠者)
  • 代理拆分(使用其他属性进行拆分,如CART处理缺失值)
  • 使用其他决策树进行估算(概念 - >缺少属性值)以查找缺少的属性值

是否要停用集成的J48(C4.5)缺失值处理?我该如何停用此功能? 我认为J48(C4.5)将使用特殊值方法在训练数据分割期间找到测试,概率分布和将对象拆分成部分,以及其他一些在分类过程中。

现在其他所有其他缺失价值的方法都可以轻松扩展J48?

非常感谢!

0 个答案:

没有答案
相关问题