比较不同回归的系数

时间:2016-12-21 16:52:29

标签: r regression

我试图将两个线性回归的系数与相同的变量进行比较,但是针对不同的子群运行。我想检查模型1中的系数是否等于模型2中的系数。我需要知道每个系数。

我的可重复数据:

Data <- data.frame(
gender = sample (c("men", "women"), 2000, replace = TRUE),
var1 = sample (c("value1", "value2"), 2000, replace = TRUE),
var2 = sample (c("valueA", "valueB"), 2000, replace = TRUE),
y = sample(0:10, 2000, replace = TRUE)
)

我运行两个回归:

men <- subset(Data, gender =="men")
women <- subset(Data, gender =="women")

lm.men <- lm(y~var1+var2, data = men)
summary(lm.men)
lm.women <- lm(y~var1+var2, data = women)
summary(lm.women)

基本上,我想测试是否:

  • var1中的系数lm.men = var1中的系数lm.women
  • var2中的系数lm.men = var2中的系数lm.women

我无法使用anova()功能,因为我的两个样本不同。我想我应该应用F测试但是我找不到这个测试的功能。

有谁知道如何解决我的问题?

1 个答案:

答案 0 :(得分:2)

正如@Barker在评论中指出的那样,这个问题的统计部分是already answered on CrossValidated;我将在这里添加一些R编码细节。

为了回答这些问题(“var1var2的效果在男性和女性之间存在显着差异吗?”,请使用具有可变性别互动的模型并测试互动条款

Data <- data.frame(
     gender = sample (c("men", "women"), 2000, replace = TRUE),
     var1 = sample (c("value1", "value2"), 2000, replace = TRUE),
    var2 = sample (c("valueA", "valueB"), 2000, replace = TRUE),
    y = sample(0:10, 2000, replace = TRUE)
 )
 mm <- lm(y~(var1+var2)*gender,Data)

以下是互动条款:

interax <- c("var1value2:genderwomen","var2valueB:genderwomen")
printCoefmat(coef(summary(mm))[interax,])
##                        Estimate Std. Error t value Pr(>|t|)
## var1value2:genderwomen  0.20144    0.28241  0.7133   0.4758
## var2valueB:genderwomen -0.15423    0.28266 -0.5456   0.5854
相关问题