根据拆分百分比将数据集拆分为两个新数据集

时间:2016-04-22 01:58:27

标签: sas proc-sql

我希望将大型数据集随机分成两个新数据集,比例为70% - 30%。

基本上我需要将70%的大数据集中的随机值分配给newdataset1,将30%的随机值从largedataset分配到newdataset2。

请帮助我帮助我实现它的SAS代码。

虚拟代码真的有帮助..

Proc SQl或SAS声明。任何事情都会对我有用。

1 个答案:

答案 0 :(得分:0)

对于复杂的样本设计(如分层随机化,例如),PROC SURVEYSELECT是一种方法,正如@Keith所说。 但是对于一个简单的随机拆分RANTBL - 函数就可以解决问题:

  data newdataset1 newdataset2;
    set have;
    flag=rantbl(-1, 0.7, 0.3);
    if flag=1 then output newdataset1;
    else output newdataset2;
  run;