随机森林下标超出界限错误?

时间:2017-04-17 14:47:17

标签: r random-forest

我正在尝试使用以下代码在R中创建一个随机林:

forest <-
randomForest(Responder_7yr ~ CD4_num_log + CD8_num_log + anergy_CD8_num_log +
             anergy_CD4_num_log + part_exhaust_CD8_num_log + exhaustion_CD8_num_log + 
             exhaustion_CD4_num_log + senescence_CD8_num_log + 
             senescence_CD4_num_log + tcm_CD4negCD8pos_num_log + 
             nTreg_CD4posCD8neg_num_log + ln_cpep + A1C + Ins, 
             data=resp, na.action=na.omit, importance=TRUE)

我收到以下错误:

Error in `[.default`(table(observed = y, predicted = out.class), levels(y),  : 
  subscript out of bounds

我已经确认所有预测变量都是正确的格式,结果是因子格式。非常感谢任何帮助!

1 个答案:

答案 0 :(得分:2)

检查您的数据,以查看各种预测因子和结果的分布情况。您可能会发现某些预测因子水平或结果水平非常高度偏差,或者某些结果或预测因子水平非常罕见。当我试图用经过大量调整的随机森林预测非常罕见的结果时,我得到了这个错误,因此一些预测器级别实际上并不在训练数据中。因此,在训练数据认为超出界限的测试数据中出现因子水平。