Como se explica en este folleto del curso (página 1) , se puede escribir un modelo lineal en la forma:
donde es la variable de respuesta y es la variable explicativa .
A menudo, con el objetivo de cumplir con los supuestos de la prueba, se puede transformar la variable de respuesta. Por ejemplo, aplicamos la función de registro en cada . Transformar una variable de respuesta NO equivale a hacer un GLM.
Se puede escribir un GLM en el siguiente formulario (del folleto del curso nuevamente (página 3) )
donde es solo otro símbolo para como entiendo de la página 2 en el folleto del curso. se llama la función de enlace.
Realmente no entiendo la diferencia entre un GLM y un LM con una variable transformada de las diapositivas en el curso. ¿Me puede ayudar con eso?
Respuestas:
Transformar la respuesta antes de hacer una regresión lineal es hacer esto:
donde es una función dada, y suponemos que g ( Y ) tiene una distribución dada (generalmente normal).g g(Y)
Un modelo lineal generalizado está haciendo esto:
donde es igual que antes, y suponemos que Y tiene una distribución dada (generalmente no es normal).g Y
fuente
No estoy seguro de si esto constituirá una respuesta completa para usted, pero puede ayudar a liberar el logjam conceptual.
Parece que hay dos conceptos erróneos en su cuenta:
Tenga en cuenta que la regresión de mínimos cuadrados ordinarios (MCO - 'lineal') es un caso especial del modelo lineal generalizado. Por lo tanto, cuando dice "[t] ransformar una variable de respuesta NO equivale a hacer un GLM", esto es incorrecto. Ajustar un modelo lineal o transformar la variable de respuesta y luego ajustar un modelo lineal, ambos constituyen 'hacer un GLM'.
(No me refiero a insistir en los errores, solo sospecho que pueden estar causando confusión).
También hay otro aspecto del modelo lineal generalizado que no veo mencionar. Es decir, especificamos una distribución de respuesta. En el caso de la regresión OLS, la distribución de respuesta es gaussiana (normal) y la función de enlace es la función de identidad. En el caso de, por ejemplo, la regresión logística (que puede ser lo que las personas piensan primero cuando piensan en GLM), la distribución de la respuesta es el Bernoulli (/ binomial) y la función de enlace es el logit. Cuando se utilizan transformaciones para garantizar que se cumplan los supuestos de OLS, a menudo intentamos que la distribución de respuesta condicional sea aceptablemente normal. Sin embargo, tal transformación no hará que la distribución de Bernoulli sea aceptablemente normal.
fuente