根据glmnet vignette,foldid
可以设置为:
foldid=sample(1:10,size=length(y),replace=TRUE)
但是,如果你看一下每个折叠中的观察数量:
> table(foldid)
foldid
1 2 3 4 5 6 7 8 9 10
10 12 8 7 12 12 8 7 14 10
分布不均匀。每次运行cvm
并lambda.min
通过上述方法预先计算cv.glmnet
(在我自己的数据集上; n <30),我的foldid
/ foldid
变化很大,并且想要尝试更均匀的观察分布(n = 100)
> foldid=sample(rep(seq(10),length=n))
> table(foldid)
foldid
1 2 3 4 5 6 7 8 9 10
10 10 10 10 10 10 10 10 10 10
。有人可以提出一种方法(代码)吗?
答案 0 :(得分:4)
没关系。在glmnet manual中找到答案。
SELECT id,dob FROM profiles WHERE DATE_ADD(dob,INTERVAL 18 YEAR) >= CURDATE() AND DATE_ADD(dob,INTERVAL 30 YEAR) <= CURDATE();
所有褶皱都有相同的观察次数。