La premisa es esta cita de la viñeta del paquete R betareg
1 .
Además, el modelo comparte algunas propiedades (como el predictor lineal, la función de enlace, el parámetro de dispersión) con modelos lineales generalizados (GLMs; McCullagh y Nelder 1989), pero no es un caso especial de este marco (ni siquiera para la dispersión fija )
Esta respuesta también hace alusión al hecho:
[...] Este es un tipo de modelo de regresión que es apropiado cuando la variable de respuesta se distribuye como Beta. Puedes considerarlo como análogo a un modelo lineal generalizado. Es exactamente lo que estás buscando [...] (énfasis mío)
El título de la pregunta lo dice todo: ¿por qué la regresión Beta / Dirichlet no se considera modelos lineales generalizados (no lo son)?
Hasta donde yo sé, el modelo lineal generalizado define modelos construidos sobre la expectativa de sus variables dependientes condicionadas a las independientes.
es la función de enlace que mapea la expectativa, es la distribución de probabilidad, los resultados y los predictores, son parámetros lineales y la varianza.
[1] Cribari-Neto, F. y Zeileis, A. (2009). Regresión beta en R.
Respuestas:
Verifique la referencia original:
Como señalan los autores, los parámetros de la distribución beta re-parametrizada están correlacionados, por lo que
Entonces, aunque el modelo parece un GLM y grazna como un GLM, no se ajusta perfectamente al marco.
fuente
La respuesta de @probabilityislogic está en el camino correcto.
La distribución beta está en la familia exponencial de dos parámetros . Los modelos GLM simples descritos por Nelder y Wedderburn (1972) no incluyen todas las distribuciones en la familia exponencial de dos parámetros.
En términos del artículo de N&W, el GLM se aplica a las funciones de densidad del siguiente tipo (más tarde se denominó familia de dispersión exponencial en Jørgensen 1987 ):
Entonces podríamos reescribir la distribución anterior también:
La familia exponencial de dos parámetros es:
La diferencia es clara, y tampoco es posible poner la distribución beta en forma de GLM.
Sin embargo, me falta la comprensión suficiente para crear una respuesta más intuitiva y bien informada (tengo la sensación de que puede haber relaciones mucho más profundas y elegantes con una variedad de principios fundamentales). El GLM generaliza la distribución del error mediante el uso de un modelo de dispersión exponencial variable única en lugar de un modelo de mínimos cuadrados y generaliza la relación lineal en la media, mediante el uso de una función de enlace.
fuente
No creo que la distribución beta sea parte de la familia de dispersión exponencial . Para obtener esto, necesitas tener una densidad
La distribución beta no se puede escribir de esta manera - una manera de ver esto es por señalar que no hay plazo en el logaritmo de verosimilitud - tiene y en lugary log[y] log[1−y]
Otra forma de ver que beta no es una familia de dispersión exponencial es que puede escribirse como donde y son independientes y ambas siguen distribuciones gamma con el mismo parámetro de escala (y gamma es familia exponencial). xzy=xx+z x z
fuente