参数调整输出NA

时间:2019-07-19 04:11:15

标签: r mlr

我是使用mlr软件包进行参数调整的新手。我最近在二进制分类问题上使用xgboost算法进行了尝试。我无法获得训练有素的准确性,只有NA。谷歌回合后,我无法调试我的代码。你能给我一些建议吗?

这是在R base中使用mtcars数据的可复制示例:

    library(mlr)
    library(parallelMap)
    mtcars
    set.seed(1)
    train.index=sample(nrow(mtcars),nrow(mtcars)*0.7)
    train=mtcars[train.index,]
    test=mtcars[-train.index,]
    list(dim(train),dim(test))

    # set the tuning
    tune.dat=train[,c('mpg','cyl','disp','wt','vs','am')]
    traintask=makeClassifTask(data=tune.dat,target='am')
    learner=makeLearner('classif.xgboost',predict.type='response',nrounds=300,nthread=2)
    prange=makeParamSet(
    makeNumericParam('eta',lower=0.01,upper=0.3),
    makeNumericParam('max_depth',lower=2,upper=10),
    makeNumericParam('subsample',lower=0.4,upper=0.8),
    makeNumericParam('colsample_bytree',lower=0.4,upper=0.8)
    )
    ctrl=makeTuneControlRandom(maxit=50)
    rdesc=makeResampleDesc('CV',iters=4)
    parallelStartMulticore(2)

    # tune
    mytune=tuneParams(learner=learner,task=traintask,par.set=prange,control=ctrl,resampling=rdesc)
    mytune$y

结果应该是数字而不是NA

1 个答案:

答案 0 :(得分:2)

我发现您的代码有2个问题:

1)“ am”字段想成为一个因素

width

2)max_depth参数要为整数

tune.dat[, 'am'] <- as.factor(tune.dat[, 'am'])

通过这些替换,输出为

makeIntegerParam('max_depth', lower = 2, upper = 10),