如何预先计算foldid,甚至每次折叠观察glmnet

时间:2015-07-30 21:20:24

标签: r cross-validation glmnet

根据glmnet vignettefoldid可以设置为:

foldid=sample(1:10,size=length(y),replace=TRUE)

但是,如果你看一下每个折叠中的观察数量:

> table(foldid)
foldid
 1  2  3  4  5  6  7  8  9 10 
10 12  8  7 12 12  8  7 14 10 

分布不均匀。每次运行cvmlambda.min通过上述方法预先计算cv.glmnet(在我自己的数据集上; n <30),我的foldid / foldid变化很大,并且想要尝试更均匀的观察分布(n = 100) > foldid=sample(rep(seq(10),length=n)) > table(foldid) foldid 1 2 3 4 5 6 7 8 9 10 10 10 10 10 10 10 10 10 10 10 。有人可以提出一种方法(代码)吗?

1 个答案:

答案 0 :(得分:4)

没关系。在glmnet manual中找到答案。

SELECT id,dob FROM profiles WHERE DATE_ADD(dob,INTERVAL 18 YEAR) >= CURDATE() AND DATE_ADD(dob,INTERVAL 30 YEAR) <= CURDATE();

所有褶皱都有相同的观察次数。

相关问题