在R中指定线性模型而不会产生对比度截距

时间:2019-06-12 21:10:06

标签: r linear-regression

我正在尝试在R中运行未指定截距的线性模型。原因是最终计算添加了截距后减少的平方和。但是,当使用内置因子对比指定此模型而不是明确说明对比值(即-.5和.5)时,我收到不同的结果。

更具体地说,使用contrasts()可以得到具有2个项(没有截距)的模型,而通过列向量显式声明对比度值可以得到正确的模型(没有截距和1个项指定对比度)。 / p>

group <- rep(c("c", "t"), each = 5)
group_cont <- rep(c(-.5, .5), each = 5)
var1 <- runif(10)
var2 <- runif(10)

test_data <- data.frame(
  group = factor(group), 
  group_cont = group_cont,
  y = var1, 
  x = var2
  )
contrasts(test_data$group) <- cbind(grp = c(-.5, .5))

summary(lm(y ~ 1 + group, data = test_data))      # full model
summary(lm(y ~ 0 + group, data = test_data))      # weird results
summary(lm(y ~ 0 + group_cont, data = test_data)) # expected

有没有一种方法可以指定没有截距的线性模型,但是仍然使用contrasts()来指定对比度?

1 个答案:

答案 0 :(得分:0)

lm()要求输入数据框和列名。使用contrasts()时,您正在为数据框中的列分配一个属性,您可以使用contrast函数或attr直接调用该属性。但是,您并没有更改数据类型本身。使用上面的示例:

> str(test_data)
  'data.frame': 10 obs. of  4 variables:
 $ group     : Factor w/ 2 levels "c","t": 1 1 1 1 1 2 2 2 2 2 #### still a factor ####
  ..- attr(*, "contrasts")= num [1:2, 1] -0.5 0.5  #### NOTE The contrast attribute ####
  .. ..- attr(*, "dimnames")=List of 2
  .. .. ..$ : chr  "c" "t"
  .. .. ..$ : chr "grp"
 $ group_cont: num  -0.5 -0.5 -0.5 -0.5 -0.5 0.5 0.5 0.5 0.5 0.5
 $ y         : num  0.161 0.518 0.417 0.335 0.301 ...
 $ x         : num  0.34 0.729 0.766 0.629 0.191 ...

> attr(test_data$group, "contrasts")

   grp
c -0.5
t  0.5

因此添加了attr,但类型仍然是一个因素。因此lm将其视为一个因素,为您提供每个级别的系数。此外,在contrast中提供attr或调用lm会引发错误。根据最终的外观,您可能需要探索一个不同的软件包,例如contrastcontrast中也有一个lm参数,但我不是100%确定这是您真正想要的。有关更多信息,请参见?lm

相关问题