¿Por qué la regresión Beta / Dirichlet no se considera modelos lineales generalizados?

26

La premisa es esta cita de la viñeta del paquete R betareg1 .

Además, el modelo comparte algunas propiedades (como el predictor lineal, la función de enlace, el parámetro de dispersión) con modelos lineales generalizados (GLMs; McCullagh y Nelder 1989), pero no es un caso especial de este marco (ni siquiera para la dispersión fija )

Esta respuesta también hace alusión al hecho:

[...] Este es un tipo de modelo de regresión que es apropiado cuando la variable de respuesta se distribuye como Beta. Puedes considerarlo como análogo a un modelo lineal generalizado. Es exactamente lo que estás buscando [...] (énfasis mío)

El título de la pregunta lo dice todo: ¿por qué la regresión Beta / Dirichlet no se considera modelos lineales generalizados (no lo son)?


Hasta donde yo sé, el modelo lineal generalizado define modelos construidos sobre la expectativa de sus variables dependientes condicionadas a las independientes.

f es la función de enlace que mapea la expectativa,g es la distribución de probabilidad,Y los resultados yX los predictores,β son parámetros lineales yσ2 la varianza.

f(E(YX))g(βX,Iσ2)

g


[1] Cribari-Neto, F. y Zeileis, A. (2009). Regresión beta en R.

Firebug
fuente
2
(+1) Relacionado: stats.stackexchange.com/a/189196 .
ameba dice Reinstate Monica
@amoeba Gracias por el enlace, no había visto esa pregunta antes.
Firebug
2
aba=b=1μϕ
@CliffAB Después de leer los comentarios bajo la respuesta de Tim a continuación, parece que la parametrización de la Beta conduce a la no ortogonalidad de los parámetros, lo que parece ser un requisito para los GLM de McCullagh-Nelder.
Firebug
1
Creo que esta respuesta breve: stats.stackexchange.com/a/18812/28666 es relevante y se agrega a las respuestas aquí (insinuando por qué los GLM se definieron originalmente con la familia de dispersión exponencial).
ameba dice Reinstate Monica

Respuestas:

20

Verifique la referencia original:

Ferrari, S. y Cribari-Neto, F. (2004). Regresión beta para modelar tasas y proporciones. Journal of Applied Statistics, 31 (7), 799-815.

Como señalan los autores, los parámetros de la distribución beta re-parametrizada están correlacionados, por lo que

βϕ

Entonces, aunque el modelo parece un GLM y grazna como un GLM, no se ajusta perfectamente al marco.

Tim
fuente
77
+1 pero sería genial tener una respuesta más detallada. Yo, personalmente, no entiendo la cita (incluso después de abrir el documento vinculado). ¿Por qué estos parámetros no son ortogonales en la regresión beta? ... ¿Por qué se requiere esto para los GLM? ... Etc.
ameeba dice Reinstate Monica el
3
@amoeba honestamente, no soy el tipo de persona que puede darte una respuesta detallada al respecto. Nunca estuve tan interesado en la teoría detrás de GLM para tener una comprensión lo suficientemente profunda de tales sutilezas. McCullagh y Nelder mencionan este requisito, pero necesitaría revisar su libro para ver por qué es exactamente importante. Si alguien ofreciera una explicación detallada de por qué esto es un problema, consideraría otorgar una recompensa por dicha respuesta.
Tim
99
g(μ)=xβϕ
3
@AchimZeileis Recordé que vi tu nombre en CV. Lo que dices tiene mucho sentido. ¿Quizás le gustaría transformar su comentario para responder agregando algo más de razón? Como dije, estaría feliz de otorgar recompensas a alguien que dé respuestas suficientemente detalladas para la pregunta.
Tim
2
@Tim intentará hacerlo cuando tenga más tiempo. Es por eso que pensé que un comentario rápido es mejor que nada ...
Achim Zeileis
8

La respuesta de @probabilityislogic está en el camino correcto.

La distribución beta está en la familia exponencial de dos parámetros . Los modelos GLM simples descritos por Nelder y Wedderburn (1972) no incluyen todas las distribuciones en la familia exponencial de dos parámetros.

En términos del artículo de N&W, el GLM se aplica a las funciones de densidad del siguiente tipo (más tarde se denominó familia de dispersión exponencial en Jørgensen 1987 ):

π(z;θ,ϕ)=exp[α(ϕ){zθg(θ)+h(z)}+β(ϕ,z)]

f()θ=f(μ)=f(Xβ)


Entonces podríamos reescribir la distribución anterior también:

π(z;μ,ϕ)=exp[z(f(μ)α(ϕ))+h(z)α(ϕ)g(f(μ))α(ϕ)+β(ϕ,z)]

La familia exponencial de dos parámetros es:

f(z;θ1,θ2)=exp[T1(z)η1(θ1,θ2)+T2(z)η2(θ1,θ2)g(θ1,θ2)+h(z)]

θ


La diferencia es clara, y tampoco es posible poner la distribución beta en forma de GLM.

Sin embargo, me falta la comprensión suficiente para crear una respuesta más intuitiva y bien informada (tengo la sensación de que puede haber relaciones mucho más profundas y elegantes con una variedad de principios fundamentales). El GLM generaliza la distribución del error mediante el uso de un modelo de dispersión exponencial variable única en lugar de un modelo de mínimos cuadrados y generaliza la relación lineal en la media, mediante el uso de una función de enlace.

α(ϕ)θθ

Sexto Empírico
fuente
ϕπ(z;θ)
@amoeba beta es una distribución familiar exponencial bivariada, por ejemplo, www2.stat.duke.edu/courses/Spring11/sta114/lec/expofam.pdf
Tim
2
No estoy seguro si no es del todo posible, incluso con dispersión fija. Al menos no de acuerdo con la glm como lo indica N&W (lo que sí sé es que muchas personas hacen cosas mucho más difíciles para resolver la regresión beta). Editaré la respuesta para mostrar qué sucede y dónde sale mal, si tratamos de seguir el mismo camino de mínimos cuadrados repesados ​​iterativos.
Sextus Empiricus
2
He editado la respuesta un poco. 1) Mi descripción inicial de las familias y los modelos de dispersión era incorrecta. El GLM incluye todas las distribuciones de las familias exponenciales de un parámetro porque no es solo esa función de densidad, sino también una función de enlace. 2) En términos de una mejor vista intuitiva, no podría llegar lejos y no espero llegar lejos pronto. Los modelos GLM se relacionan con el modelo clásico en varias representaciones, agregando ponderaciones a la formulación matricial de los procedimientos de ajuste, derivados de las funciones de log-verosimilitud, incluidos los términos con la función de enlace y la varianza, .....
Sextus Empiricus
2
Me tomé la libertad de editar un poco tu respuesta, espero que estés bien con las ediciones. Además, parece que esta respuesta stats.stackexchange.com/a/18812/28666 sugiere por qué N&W utilizó esta familia de distribución en particular y no una más amplia.
ameba dice Reinstate Monica
2

No creo que la distribución beta sea parte de la familia de dispersión exponencial . Para obtener esto, necesitas tener una densidad

f(y;θ,τ)=exp(yθc(θ)τ+d(y,τ))

c()d()c(θ)τc(θ)θ

La distribución beta no se puede escribir de esta manera - una manera de ver esto es por señalar que no hay plazo en el logaritmo de verosimilitud - tiene y en lugarylog[y]log[1y]

fbeta(y;μ,ϕ)=exp(ϕμlog[y1y]+ϕlog[1y]log[B(ϕμ,ϕ(1μ)]log[y1y])

Otra forma de ver que beta no es una familia de dispersión exponencial es que puede escribirse como donde y son independientes y ambas siguen distribuciones gamma con el mismo parámetro de escala (y gamma es familia exponencial). xzy=xx+zxz

probabilidadislogica
fuente
1
Esta respuesta no es correcta como está escrita. Una forma de ver esto es que, de acuerdo con la lógica presentada, las distribuciones de Bernoulli y binomial, por ejemplo, tampoco estarían en la clase de familias exponenciales.
cardenal
2
Lo siento, tienes razón en que el ejemplo que di fue erróneo. (Advertencia: ¡la aritmética mental y el uso móvil de CrossValidated pueden ser peligrosos!) Sin embargo, mi punto sigue en pie. Esta respuesta es incorrecta porque opta por un concepto muy "definido" de "familia exponencial", mucho más limitado que cualquier fuente convencional o uso práctico.
cardenal
2
Hmm Wikipedia enumera beta en la lista de distribuciones familiares exponenciales.
ameba dice Reinstate Monica
1
Es cierto - Estaba pensando en la familia exponencial naturales - que es un caso especial
probabilityislogic
1
El parámetro en la función también se describe mediante una función de enlace, y luego esta función de distribución estrechamente definida se vuelve más amplia, incluidas todas las distribuciones de la familia exponencial de un parámetro, pero solo algunas de las dos familias exponenciales de parámetro. θ
Sextus Empiricus