Considere un caso donde su variable de respuesta es un conjunto de 'éxitos' y 'fracasos' (también representados como 'sí' y 'nos', 1s y 0s, etc.). Si esto fuera cierto, no puede darse el caso de que su término de error se distribuya normalmente . En cambio, su término de error sería Bernoulli , por definición. Por lo tanto, se viola uno de los supuestos a los que se alude. Otro supuesto de este tipo es el de la homocedasticidad, pero esto también se violaría, porque la varianza es una función de la media. Entonces podemos ver que el GLM (OLS) es inapropiado para este caso.
Tenga en cuenta que, para un modelo de regresión lineal típico, lo que está prediciendo (es decir, y^i) es μi, la media de la distribución normal condicional de la respuesta en ese punto exacto donde X=xi. Lo que necesitamos en este caso es predecirπ^i, la probabilidad de 'éxito' en ese punto. Así que pensamos en nuestra distribución de respuestas como Bernoulli, y estamos prediciendo el parámetro que controla el comportamiento de esa distribución. Sin embargo, aquí hay una complicación importante. Específicamente, habrá algunos valores paraXeso, en combinación con sus estimaciones producirá valores pronosticados de (es decir, ) que serán o . Pero esto es imposible, porque el rango de es . Por lo tanto, necesitamos transformar el parámetro para que pueda variar , tal como puede hacerlo el lado derecho de su GLiM. Por lo tanto, necesita una función de enlace . βy^iπ^i<0>1π(0, 1)π(−∞, ∞)
En este punto, hemos estipulado una distribución de respuesta (Bernoulli) y una función de enlace (quizás la transformación logit ). Ya tenemos una parte estructural de nuestro modelo: . Así que ahora tenemos todas las partes requeridas de nuestro modelo. Este es ahora el modelo lineal generalizado, porque hemos "relajado" los supuestos sobre nuestra variable de respuesta y los errores. Xβ
Para responder sus preguntas específicas más directamente, el modelo lineal generalizado relaja las suposiciones sobre y al colocar una distribución de respuesta (en la familia exponencial ) y una función de enlace que asigna el parámetro en cuestión al intervalo . YU(−∞, ∞)
Para obtener más información sobre este tema, puede ayudarlo a leer mi respuesta a esta pregunta: Diferencia entre modelos logit y probit .