Específicamente, quiero saber si hay una diferencia entre lm(y ~ x1 + x2)
y glm(y ~ x1 + x2, family=gaussian)
. Creo que este caso particular de glm es igual a lm. ¿Me equivoco?
r
normal-distribution
generalized-linear-model
lm
usuario3682457
fuente
fuente
Respuestas:
Mientras que para la forma específica de modelo mencionada en el cuerpo de la pregunta (es decir,
lm(y ~ x1 + x2)
vsglm(y ~ x1 + x2, family=gaussian)
), la regresión y los GLM son el mismo modelo, la pregunta del título hace algo un poco más general:A lo que la respuesta es "¡Sí!".
La razón por la que pueden ser diferentes es porque también puede especificar una función de enlace en el GLM. Esto le permite ajustar formas particulares de relación no lineal entre (o más bien su media condicional) y las variables ; Si bien también puede hacer esto , no hay necesidad de valores iniciales, a veces la convergencia es mejor (también la sintaxis es un poco más fácil).y x
nls
Compare, por ejemplo, estos modelos (tiene R, así que supongo que puede ejecutarlos usted mismo):
Tenga en cuenta que el primer par es el mismo modelo ( ), y el segundo par es el mismo modelo ( y los ajustes son esencialmente los mismos dentro de cada par.yi∼N(β0+β1x1i+β2x2i,σ2) yi∼N(exp(β0+β1x1i+β2x2i),σ2)
Entonces, en relación con la pregunta del título, puede ajustar una variedad sustancialmente más amplia de modelos gaussianos con un GLM que con una regresión.
fuente
MASS::rlm
Respuesta corta, son exactamente lo mismo:
Respuesta más larga; La función glm se ajusta al modelo de MLE, sin embargo, debido a la suposición que hizo sobre la función de enlace (en este caso normal), termina con las estimaciones de OLS.
fuente
glm
esglm(y ~ x1 + x2, family = gaussian(link = "identity"))
.De la respuesta de @ Repmat, el resumen del modelo es el mismo, pero los IC de los coeficientes de regresión de
confint
son ligeramente diferentes entrelm
yglm
.lm
mientras que la distribución normal se usaglm
al construir los intervalos.fuente