我必须在使用缺失数据的一些任务中使用J48树归纳算法。现在我将做一些经验研究来比较J48树归纳的不同缺失值方法,以及不同的UCI训练数据集和这些数据集上的不同人工截肢率(标准,+ 10%,+ 40%截肢)。
我的主要问题是,我如何使用Weka J48类在J48源代码中实现以下方法,或者更好地在我自己的代码中实现。我可以将这种方法作为元分类器或其他方式处理吗? 方法我想测试作为J48标准处理和随机森林的对应物:
是否要停用集成的J48(C4.5)缺失值处理?我该如何停用此功能? 我认为J48(C4.5)将使用特殊值方法在训练数据分割期间找到测试,概率分布和将对象拆分成部分,以及其他一些在分类过程中。
现在其他所有其他缺失价值的方法都可以轻松扩展J48?
非常感谢!