R - 如何从岭回归结果中提取T统计量

时间:2013-08-19 10:02:37

标签: r regression

我正在使用R中的ridge regression package,但在系数列表中提取T统计数据,p值时遇到了问题。

以下是here的一些示例代码;

data(GenCont)
mod <- linearRidge(Phenotypes ~ ., data = as.data.frame(GenCont))
summary(mod)

返回

Call:
linearRidge(formula = Phenotypes ~ ., data = as.data.frame(GenCont))

Coefficients:
             Estimate Scaled estimate Std. Error (scaled) t value (scaled) Pr(>|t|)    
(Intercept)  1.533386              NA                  NA               NA       NA    
SNP1         0.277296        4.045409            0.266120           15.201  < 2e-16 ***
SNP2        -0.110458       -1.256154            0.216332            5.807 6.38e-09 ***

但我想以编程方式访问“系数”中的数据。我明白如果我使用lm,那么就像

那样
coef(summary(mod))

应该可行,但这似乎并不像我追求的那样。我只是得到一个NULL。

有关如何访问此数据的任何想法吗?

1 个答案:

答案 0 :(得分:3)

要获取自动选择岭参数的情况的系数表,您应该将summary()结果存储为某个对象,然后访问列表元素summaries$summary1$coefficients。您可以使用函数summary()查看str(sumar)对象的整个结构。

sumar<-summary(mod)
sumar$summaries$summary1$coefficients
                Estimate Scaled estimate Std. Error (scaled) t value (scaled)     Pr(>|t|)
(Intercept)  1.533385893              NA                  NA               NA           NA
SNP1         0.277296215     4.045408706           0.2661197      15.20146202 0.000000e+00
SNP2        -0.110457822    -1.256153622           0.2163319       5.80660491 6.375233e-09
SNP3        -0.110457822    -1.256153622           0.2163319       5.80660491 6.375233e-09
SNP4         0.005229639     0.011635212           0.3716925       0.03130332 9.750276e-01
SNP5         0.531172545     6.323006229           0.3153685      20.04958196 0.000000e+00
SNP6        -0.119163534    -1.373227248           0.2230470       6.15667175 7.428960e-10
SNP7         0.113843942     0.113730041           0.3721807       0.30557749 7.599264e-01
SNP8        -0.099148877    -1.028580596           0.3558067       2.89084074 3.842128e-03
SNP9        -0.008320553    -0.008312229           0.3723863       0.02232152 9.821915e-01
SNP10        0.058562323     0.101128163           0.3715670       0.27216670 7.854938e-01
SNP11       -0.096526424    -1.495698673           0.3292496       4.54275034 5.552500e-06
SNP12       -0.334279101    -0.333944654           0.3722483       0.89710186 3.696646e-01

要仅获取t值,请选择此表的第四列。

> sumar$summaries$summary1$coefficients[,4]
(Intercept)        SNP1        SNP2        SNP3        SNP4        SNP5        SNP6        SNP7        SNP8        SNP9 
         NA 15.20146202  5.80660491  5.80660491  0.03130332 20.04958196  6.15667175  0.30557749  2.89084074  0.02232152 
      SNP10       SNP11       SNP12 
 0.27216670  4.54275034  0.89710186 

要访问summary()函数生成的其他元素,您只需选择适当的列表元素即可。 摘要对象的结构显示了要选择的元素。

str(sumar$summaries$summary1)
List of 4
 $ coefficients: num [1:13, 1:5] 1.53339 0.2773 -0.11046 -0.11046 0.00523 ...
  ..- attr(*, "dimnames")=List of 2
  .. ..$ : chr [1:13] "(Intercept)" "SNP1" "SNP2" "SNP3" ...
  .. ..$ : chr [1:5] "Estimate" "Scaled estimate" "Std. Error (scaled)" "t value (scaled)" ...
 $ df          : Named num [1:3] 3.12 1.21 5.04
  ..- attr(*, "names")= chr [1:3] "model" "variance" "residual"
 $ nPCs        : int 1
 $ lambda      : num 2.21

例如,获取df

sumar$summaries$summary1$df
   model variance residual 
3.120934 1.205412 5.036457 

也可以在不创建新对象的情况下选择结果 - 只需使用summary(mod)而不是对象名sumar

summary(mod)$summaries$summary1$df
   model variance residual 
3.120934 1.205412 5.036457