如何计算R中的Kendall Tau相关系数的p值?

时间:2019-08-01 14:31:32

标签: r correlation p-value

我已经使用以下方法计算了Kendal相关系数:

corr_test <- cor.test(values, use = "pairwise", method="kendall")
corr_test

但是我需要p值。我找不到任何为kendall相关提供p值的软件包。 如何计算kendall tau相关系数的p值?

此任务的最终目标是生成一个相关图,其中彩色单元格表示显着的相关系数。我使用kendall tau是因为数据中有很多联系,并且一个变量是一个因素。

enter image description here

1 个答案:

答案 0 :(得分:1)

您可以简单地遍历数据的列(或行,如果需要的话),以对每个列组合使用cor.test(),如下所示:

# Use some data
mat <- iris[,1:4]

# Index combinations of columns
# Not very efficient, but it'll do for now
idx <- expand.grid(colnames(mat), colnames(mat))

# Loop over indices, calculate p-value
pvals <- apply(idx, 1, function(i){
  x <- mat[,i[[1]]]
  y <- mat[,i[[2]]]
  cor.test(x, y, method = "kendall")$p.value
})
# Combine indices with pvalues, do some sort of multiple testing correction
# Note that we are testing column combinations twice 
# so we're overcorrecting with the FDR here
pvals <- cbind.data.frame(idx, pvals = p.adjust(pvals, "fdr"))

接下来,您将不得不用常规的相关值来补充这些值,并将它们与p值结合起来。

# Calculate basic correlation
cors <- cor(mat, method = "kendall")
cors <- reshape2::melt(cors)

# Indices of correlations and pvalues should be the same, thus can be merged
if (identical(cors[,1:2], pvals[,1:2])) {
  df <- cbind.data.frame(pvals, cor = cors[,3])
}

并按照以下方式绘制数据:

# Plot a matrix
ggplot(df, aes(Var1, Var2, fill = ifelse(pvals < 0.05, cor, 0))) +
  geom_raster() +
  scale_fill_gradient2(name = "Significant Correlation", limits = c(-1, 1))

enter image description here

另一种选择是使用idx <- t(combn(colnames(mat), 2)),在这种情况下,可以进行多次测试校正,但是您必须弄清楚如何操纵这些值以再次与相关性匹配。