采样数据帧具有2级分类相等的概率

时间:2016-04-08 19:19:47

标签: r sampling

我正在努力完成以下任务:

  1. 我有一个包含许多变量的数据集,其中一个名为Gender,因此有2个级别" M"和" F"。

  2. 我想在没有替换这个数据集的情况下进行采样,让我们​​说1000次观察,所以我得到相同数量的" M"和" F",每个500。

  3. 贝娄是我正在尝试的代码。 x是数据集,因此x$gender是变量列

    test_sample<- x[sample(nrow(x),1000,replace = FALSE,prob = ?) ,]
    

    我知道如何才能使这项工作?

1 个答案:

答案 0 :(得分:0)

对于某些data.frame,df应该接近变量Gender:

males <- which(df$Gender == "M")
females <- which(df$Gender == "F")

malesSampled <- sample(males, size=500)
femalesSampled <- sample(females, size=500)

dfSampled <- df[c(malesSampled, femalesSampled),]