在使用稳健的Mahalanobis距离后去除多变量异常值

时间:2016-03-17 16:30:39

标签: r outliers multivariate-testing mahalanobis

我有一个包含3个变量的167个观察数据集。我正在尝试使用强大的Mahalanobis距离来评估和消除多变量异常值。为此,我一直在使用Moutlier包中的chemometrics函数。

我对R很新,所以我有一些问题:

这是我的代码:

data<-isotopes  
  x=data[,c(3:5)] #columns 3-5 contain the data I need to assess  
  require(robustbase)  
  res <- Moutlier(data[,c(3:5)] ,quantile=0.975,plot=TRUE)  
  res  
  which(res$rd>res$cutoff) 

1)之前是否有人使用过此代码,我是否正确完成了此操作?

2)在执行此功能之前是否需要标准化数据,还是无关紧要?

3)使用which函数后,结果为:

# [1]  13  28  29  47  79  84  89  91 104 128 153 154 

这是否意味着这些数字对应于观察#13,#28,#29等? 对于所有3个变量,那些是我要删除的异常值?

非常感谢能够提供帮助的任何人......

0 个答案:

没有答案