通过数据集

时间:2017-04-02 22:11:09

标签: r filter dplyr na

我有一个包含年龄和收入变量的数据集。收入列有一些缺失值。我想写一个代码,我可以获得收入变量的所有缺失值的年龄变量的所有值,即我的代码的结果将显示收入值为NA的年龄。我试图使用dplyr函数执行此操作,但我被卡住了。我知道这很简单,但我无法做到这一点。任何人都可以为此建议代码。感谢

1 个答案:

答案 0 :(得分:0)

一些测试数据:

data<-data.frame(Age   = c(23,28,27,31,42,26,48,23,32,31),
                 income = c(20000, NA, 30000, 25000, NA, NA, 35000, NA, 40000, 250000))
> data
   Age income
1   23  20000
2   28     NA
3   27  30000
4   31  25000
5   42     NA
6   26     NA
7   48  35000
8   23     NA
9   32  40000
10  31 250000

明确使用dplyr包:

require(dplyr)
data %>% filter(is.na(income))

  Age income
1  28     NA
2  42     NA
3  26     NA
4  23     NA