R - 立即删除所有异常值

时间:2017-11-30 10:52:07

标签: r dataframe boxplot outliers

我在R中导入了一个数据集,我试图删除异常值。到目前为止,我做到了这一点,我用箱线图确定了所有异常值,并将它们保存在变量中。

outlier_values_2 <- boxplot.stats(myfileswoNA$smart_1_raw)$out  # outlier values.
boxplot(myfileswoNA$smart_1_raw, main="Outlier", boxwex=0.1)

hist(myfileswoNA$smart_1_raw)
summary(myfileswoNA$smart_1_raw)

现在我正在尝试删除带有已识别异常值的行。我可以用一个特定值来做到这一点:

example <- myfileswoNA[myfileswoNA$smart_1_raw!=4294967295,]

但我想要做的是立即删除所有异常值,这些异常值存储在变量outlier_values_2中 例如,这种方式不起作用:

example <- myfileswoNA[myfileswoNA$smart_1_raw!=4294967295,]

任何人都可以帮我解决这个问题吗?或者有人有想法吗?

1 个答案:

答案 0 :(得分:0)

@LAP的回答帮助我解决了我的问题。 以下是他的建议:

  

如果所有离群值都存储在outlier_values_2中,   尝试   myfileswoNA[!myfileswoNA$smart_1_raw %in% outlier_values_2,]

相关问题