我正在尝试在R中运行未指定截距的线性模型。原因是最终计算添加了截距后减少的平方和。但是,当使用内置因子对比指定此模型而不是明确说明对比值(即-.5和.5)时,我收到不同的结果。
更具体地说,使用contrasts()
可以得到具有2个项(没有截距)的模型,而通过列向量显式声明对比度值可以得到正确的模型(没有截距和1个项指定对比度)。 / p>
group <- rep(c("c", "t"), each = 5)
group_cont <- rep(c(-.5, .5), each = 5)
var1 <- runif(10)
var2 <- runif(10)
test_data <- data.frame(
group = factor(group),
group_cont = group_cont,
y = var1,
x = var2
)
contrasts(test_data$group) <- cbind(grp = c(-.5, .5))
summary(lm(y ~ 1 + group, data = test_data)) # full model
summary(lm(y ~ 0 + group, data = test_data)) # weird results
summary(lm(y ~ 0 + group_cont, data = test_data)) # expected
有没有一种方法可以指定没有截距的线性模型,但是仍然使用contrasts()
来指定对比度?
答案 0 :(得分:0)
lm()
要求输入数据框和列名。使用contrasts()
时,您正在为数据框中的列分配一个属性,您可以使用contrast
函数或attr
直接调用该属性。但是,您并没有更改数据类型本身。使用上面的示例:
> str(test_data)
'data.frame': 10 obs. of 4 variables:
$ group : Factor w/ 2 levels "c","t": 1 1 1 1 1 2 2 2 2 2 #### still a factor ####
..- attr(*, "contrasts")= num [1:2, 1] -0.5 0.5 #### NOTE The contrast attribute ####
.. ..- attr(*, "dimnames")=List of 2
.. .. ..$ : chr "c" "t"
.. .. ..$ : chr "grp"
$ group_cont: num -0.5 -0.5 -0.5 -0.5 -0.5 0.5 0.5 0.5 0.5 0.5
$ y : num 0.161 0.518 0.417 0.335 0.301 ...
$ x : num 0.34 0.729 0.766 0.629 0.191 ...
> attr(test_data$group, "contrasts")
grp
c -0.5
t 0.5
因此添加了attr
,但类型仍然是一个因素。因此lm
将其视为一个因素,为您提供每个级别的系数。此外,在contrast
中提供attr
或调用lm
会引发错误。根据最终的外观,您可能需要探索一个不同的软件包,例如contrast。 contrast
中也有一个lm
参数,但我不是100%确定这是您真正想要的。有关更多信息,请参见?lm
。