Estimador de máxima verosimilitud para el mínimo de distribuciones exponenciales

10

Estoy atrapado en cómo resolver este problema.

Entonces, tenemos dos secuencias de variables aleatorias, e para . Ahora, e son distribuciones exponenciales independientes con parámetros y . Sin embargo, en vez de observar y , observamos en lugar y .XiYii=1,...,nXYλμXYZW

Z=min(Xi,Yi) y W=1 si Zi=Xi y 0 si Zi=Yi . Tengo que encontrar formas cerradas para los estimadores de máxima verosimilitud de λ y μ sobre la base de Z y W . Además, tenemos que demostrar que estos son máximos globales.

Ahora, sé que el mínimo de dos exponenciales independientes es en sí mismo exponencial, con la tasa igual a la suma de las tasas, por lo que sabemos que Z es exponencial con el parámetro λ+μ . Por lo tanto, nuestro estimador de máxima verosimilitud es: λ^+μ^=Z¯ .

Pero estoy atrapado con dónde ir desde aquí. Sé que W es una distribución de Bernoulli con el parámetro p=P(Zi=Xi) , pero no sé cómo convertir esto en una declaración sobre uno de los parámetros. Por ejemplo, ¿qué estaría estimando el MLE W¯ en términos de λ y / o μ ? Entiendo que si Zi=Xi , entonces μ=0 , pero estoy teniendo dificultades para descubrir cómo llegar a cualquier enunciado algebraico, aquí.

ACTUALIZACIÓN 1: Así que me han dicho en los comentarios para derivar la probabilidad para la distribución conjunta de Z y W .

Entonces donde . ¿Correcto? No sé cómo más derivar una distribución conjunta en este caso, ya que y no son independientes.f(Z,W)=f(Z|W=1)p+f(Z|W=0)(1p)p=P(Zi=Xi)ZW

Entonces esto nos da, , según la definición de anterior. Pero ahora que? Esto no me lleva a ninguna parte. Si voy a través de las etapas de calcular la probabilidad, consigo: (con y como los tamaños de las muestras para cada parte de la mezcla ...)f(Zi,Wi)=pλeλzi+(1p)μeμziWmn

L(λ,μ)=pmλmeλzi+(1p)nμneμzi

logL=mlogp+mlogλλzi+nlog(1p)+nlogμμzi

Si tomo las derivadas parciales, esto me dice que mi MLE estimaciones de y son sólo la media de la 's condicionada a . Es decir,λμZW

λ^=Zim

μ^=Zin

y

p^=mn+m

Ryan Simmons
fuente
1
Habiendo respondido una pregunta MLE similar hoy, ¿puedo dirigirlo hacia esa solución para algunas ideas? La relación entre las preguntas es que sus datos también se dividen naturalmente en dos grupos disjuntos: aquellos donde y aquellos donde . Todo se reduce a escribir la probabilidad de una observación de la forma ; La simetría entre e , y , produce inmediatamente la probabilidad de datos de la forma y luego está listo y funcionando. W=0W=1(Z,W)=(z,0)XYμλ(z,1)
whuber
¡No te apresures a escribir la máxima probabilidad! Primero, exprese la distribución conjunta de , luego deduzca la probabilidad asociada con la muestra de , que resulta ser de forma cerrada gracias al supuesto exponencial. Entonces, y solo entonces, puede intentar maximizar la función y, por lo tanto, obtener la máxima probabilidad. (Z,W)(Zi,W)=i)
Xi'an
@whuber: (+1) es bastante sencillo e implica la separación entre los y los pero ambos grupos involucran tanto a como a , ya que aportan información sobre ambos e , ya que . (zi,1)(zi,0) μλ XiYiWi=I(Xi<Yi)
Xi'an
2
@ Xi'an Eso es correcto, y los paralelos con el ejemplo de la teoría normal que enlace para continuar manteniendo, porque allí ambos grupos proporcionan información sobre el parámetro común (la escala), cuya estimación implicará así la "agrupación" de datos de los grupos Aquí se verá que nos dice cómo la estimación de (la tasa, o escala inversa, para ) se debe distribuir en estimaciones separadas de y . σW¯λ+μZλμ
whuber
He leído el otro hilo, whuber, pero honestamente no entiendo cómo aplicar eso a este ejemplo. Z y W no son independientes, entonces, ¿cómo obtengo la distribución conjunta?
Ryan Simmons

Respuestas:

1

No tengo suficientes puntos para comentar, así que escribiré aquí. Creo que el problema que publica puede verse desde una perspectiva de análisis de supervivencia, si considera lo siguiente:

Xi : verdadero tiempo de supervivencia,

Yi : tiempo de ,

Ambos tienen una distribución exponencial con e independientes. Entonces es el tiempo de supervivencia observado y el indicador de censura.XYZiWi

Si está familiarizado con el análisis de supervivencia, creo que puede comenzar desde este punto.

Notas: Una buena fuente: Análisis de datos de supervivencia por DRCox y D.Oakes

A continuación se muestra un ejemplo: Suponiendo que el pdf de la distribución del tiempo de supervivencia es . Entonces la función de supervivencia es: . Y la probabilidad de registro es:f(t)=ρeρtS(t)=eρt

l=ulogf(zi)+clogS(zi)

con resumen sobre personas sin censura ( ) y personas censuradas ( ) respectivamente.uc

Debido al hecho de que donde h (t) es la función de peligro, esto se puede escribir:f(t)=h(t)S(t)

l=ulogh(zi)+logS(zi)

l=ulogρρzi

Y el estimador de máxima verosimilitud de es:ρ^ρ

ρ^=d/zi donde es el número total de casos dedWi=1

jujae
fuente