Question

R中的许多操作都需要从数据集中删除NA。就我而言，我想使用kmeans将连续测量分为三个因素：

kmeans.2006<-kmeans(na.omit(media.2006), 3)

这显然会为media.2006创建一个不同长度的向量。我想要做的是将此向量替换为media.2006（或相同长度的新向量）。我想我想要做的是写一个类似下面的循环，但告诉计数器跳过任何NA。

kmeans.2006<-kmeans(na.omit(media.2006), 3)

n <- length(media.2006)
k <- length(kmeans.2006)

media.factor.2006 <- rep(NA, n)

for(i in 1:n){
 for(j in 1:k){
media.factor[i] <- ifelse(is.na(media.2006[i]) != TRUE, kmeans.2006[j], media.2006[i])
 }
}

要清楚，这不起作用，但我想像这个woudl工作，如果我可以告诉j计数器跳过i计数器遇到（借口双关语）NA的情况。有什么想法吗？

作为参考，我有：

> dput(media.2006)
c(NA, NA, NA, 0L, 0L, 0L, 385L, 0L, 51L, 0L, 0L, 0L, 0L, 0L, 
0L, 0L, 0L, 47L, 20L, NA, 0L, 16L, 116L, 84L, 20L, NA, 0L, 3L, 
28L, 940L, 741L, 177L, 984L, 0L, 27L, 19L, 294L, 79L, 1L, 17L, 
152L, 35L, 87L, 946L, 0L, 0L, 0L, 27L, 10L, 9L, 395L, 25L, 0L, 
0L, 0L, 0L, 58L, 1198L, 0L, 0L, 0L, NA, 19L, 0L, 19L, 2L, 0L, 
2L, 25L, 0L, 0L)

Answer 1

这比你想象的要容易。

media.factor.2006 <- rep(NA, length(media.2006))
media.factor.2006[!is.na(media.2006)] <- kmeans.2006$cluster

is.na会返回length(media.2006)和!的逻辑向量，您将其反转，因此您要告知用kmeans.2006替换media.2006中不是NA的所有内容。

删除后添加NAs

1 个答案: