¿Qué distribuciones tienen soluciones de forma cerrada para la estimación de máxima verosimilitud?

Respuestas:

25

Sin ninguna pérdida apreciable de generalidad, podemos suponer que la densidad de probabilidad (o masa) para cualquier observación x i (de n observaciones) es estrictamente positiva, lo que nos permite escribirla como exponencialF(Xyo)Xyonorte

F(Xyo)=Exp(sol(Xyo,θ))

para un vector de parámetros .θ=(θj)

Al igualar el gradiente de la función de probabilidad logarítmica a cero (que encuentra puntos estacionarios de la probabilidad, entre los cuales estarán todos los máximos globales interiores si existe), proporciona un conjunto de ecuaciones de la forma

yoresol(Xyo,θ)reθj=0 0,

uno para cada . Para que cualquiera de estos tenga una solución lista, nos gustaría poder separar los términos x i de los términos θ . (Todo surge de esta idea clave, motivada por el Principio de la holgazanería matemática : hacer el menor trabajo posible; pensar con anticipación antes de la computación; abordar primero las versiones fáciles de problemas difíciles). La forma más general de hacerlo es que las ecuaciones tomen la formajXyoθ

yo(ηj(θ)τj(Xyo)-αj(θ))=ηj(θ)yoτj(Xyo)-norteαj(θ)

para funciones conocidas , τ j y α j , para entonces la solución se obtiene resolviendo las ecuaciones simultáneasηjτjαj

norteαj(θ)ηj(θ)=yoτj(Xyo)

para . En general, estos serán difíciles de resolver, pero siempre que el conjunto de valores de ( n α j ( θ )θproporciona información completa sobreθ, podríamos simplemente usar este vectoren lugar deθ ensí mismo (generalizando de alguna manera la idea de una solución de "forma cerrada", pero de una manera altamente productiva). En tal caso, la integración con respecto aθjproduce(norteαj(θ)ηj(θ))θ θθj

sol(X,θ)=τj(X)θηj(θ)reθj-θαj(θ)reθj+si(X,θj)

(donde representa todos los componentes de θ excepto θ j ). Debido a que el lado izquierdo es funcionalmente independiente de θ j , debemos tener que τ j ( x ) = T ( x ) para alguna función fija T ; que B no debe depender de θ en absoluto; y η j son derivadas de alguna función H ( θ ) y α j son derivadas de alguna otra función Aθjθθjθjτj(X)=T(X)TsiθηjH(θ)αj , ambos funcionalmente independientes de los datos. De dóndeUNA(θ)

sol(X,θ)=H(θ)T(X)-UNA(θ)+si(X).

Las densidades que se pueden escribir de esta forma forman la conocida familia Koopman-Pitman-Darmois , o exponencial . Comprende familias paramétricas importantes, tanto continuas como discretas, que incluyen Gamma, Normal, Chi-cuadrado, Poisson, Multinomial y muchas otras .

whuber
fuente
Y para aquellos que no tienen formas cerradas, podríamos usar el algoritmo EM. Por ejemplo, considere el modelo de poisson inflado a cero: stats.stackexchange.com/questions/32133/…
Damien
0

No sé si podría enumerarlos a todos. Lo exponencial, lo normal y el binomio vienen a la mente y todos caen en la clase de familias exponenciales. La familia exponencial tiene su estadística suficiente en el exponente y el mle es a menudo una buena función de esta estadística suficiente.

Michael R. Chernick
fuente
8
Esta pregunta es increíblemente amplia, pero parece que el OP puede estar preguntando qué caracteriza a una distribución que tiene una solución de forma cerrada para el MLE en lugar de pedir una lista exhaustiva. En cualquier caso, una lista exhaustiva ni siquiera es posible.
Macro
2
[Iniciar sesiónXIniciar sesión(1-X)]Tunasi
Thnaks Neil por señalar eso. Supongo que no todas las distribuciones familiares exponenciales tienen soluciones de forma cerrada.
Michael R. Chernick