¿Cómo generaliza el modelo lineal generalizado el modelo lineal general?

8

De Wikipedia

El modelo lineal general (GLM) es un modelo lineal estadístico. Puede escribirse como 1

Y=XB+U,
dónde Y es una matriz con series de mediciones multivariadas, X es una matriz que podría ser una matriz de diseño, B es una matriz que contiene parámetros que generalmente se estiman y Ues una matriz que contiene errores o ruido. Por lo general, se supone que los errores siguen una distribución normal multivariada.

Luego dice

Si los errores no siguen una distribución normal multivariante, se pueden usar modelos lineales generalizados para relajar los supuestos sobre Y y U.

Me preguntaba cómo los modelos lineales generalizados relajan los supuestos sobre Y y U en los modelos lineales generales?

Tenga en cuenta que puedo entender su otra relación en la dirección opuesta:

El modelo lineal general puede verse como un caso del modelo lineal generalizado con enlace de identidad.

Pero dudo que esto ayude con mi pregunta.

Tim
fuente

Respuestas:

10

Considere un caso donde su variable de respuesta es un conjunto de 'éxitos' y 'fracasos' (también representados como 'sí' y 'nos', 1s y 0s, etc.). Si esto fuera cierto, no puede darse el caso de que su término de error se distribuya normalmente . En cambio, su término de error sería Bernoulli , por definición. Por lo tanto, se viola uno de los supuestos a los que se alude. Otro supuesto de este tipo es el de la homocedasticidad, pero esto también se violaría, porque la varianza es una función de la media. Entonces podemos ver que el GLM (OLS) es inapropiado para este caso.

Tenga en cuenta que, para un modelo de regresión lineal típico, lo que está prediciendo (es decir, y^i) es μi, la media de la distribución normal condicional de la respuesta en ese punto exacto donde X=xi. Lo que necesitamos en este caso es predecirπ^i, la probabilidad de 'éxito' en ese punto. Así que pensamos en nuestra distribución de respuestas como Bernoulli, y estamos prediciendo el parámetro que controla el comportamiento de esa distribución. Sin embargo, aquí hay una complicación importante. Específicamente, habrá algunos valores paraXeso, en combinación con sus estimaciones producirá valores pronosticados de (es decir, ) que serán o . Pero esto es imposible, porque el rango de es . Por lo tanto, necesitamos transformar el parámetro para que pueda variar , tal como puede hacerlo el lado derecho de su GLiM. Por lo tanto, necesita una función de enlace . βy^iπ^i<0>1π(0, 1)π(, )

En este punto, hemos estipulado una distribución de respuesta (Bernoulli) y una función de enlace (quizás la transformación logit ). Ya tenemos una parte estructural de nuestro modelo: . Así que ahora tenemos todas las partes requeridas de nuestro modelo. Este es ahora el modelo lineal generalizado, porque hemos "relajado" los supuestos sobre nuestra variable de respuesta y los errores. Xβ

Para responder sus preguntas específicas más directamente, el modelo lineal generalizado relaja las suposiciones sobre y al colocar una distribución de respuesta (en la familia exponencial ) y una función de enlace que asigna el parámetro en cuestión al intervalo . YU(, )

Para obtener más información sobre este tema, puede ayudarlo a leer mi respuesta a esta pregunta: Diferencia entre modelos logit y probit .

gung - Restablece a Monica
fuente
(+1) Respuesta concisa y comprensible.
COOLSerdash
Gracias Gung! En los modelos lineales generales, "se supone que los errores siguen una distribución normal multivariante". ¿Es correcto que los modelos lineales generales no sean necesariamente paramétricos en el sentido de que no especifican completamente la forma de la distribución de Y dada X? Debido a que un modelo lineal generalizado siempre especifica la distribución de Y dada X como una distribución familiar exponencial, ¿es correcto que un modelo lineal general no sea un modelo lineal generalizado?
Tim
No, el modelo lineal general está completamente especificado; Siempre es un caso especial del modelo lineal generalizado.
gung - Restablece a Monica
¿"Se supone generalmente que los errores siguen una distribución normal multivariada" en WIkipedia para el modelo lineal general significa que el error puede no distribuirse normalmente?
Tim