En el Análisis de supervivencia, se supone que el tiempo de supervivencia de un rv se distribuye exponencialmente. Considerando ahora que tengo "resultados" de iid rv's . De hecho, solo una parte de estos resultados está "plenamente realizada", es decir, las observaciones restantes aún están "vivas".
Si quisiera realizar una estimación ML para el parámetro de tasa de la distribución, ¿cómo puedo utilizar las observaciones no realizadas de manera coherente / apropiada? Creo que todavía contienen información útil para la estimación.
¿Podría alguien guiarme a la literatura sobre este tema? Estoy seguro de que existe. Sin embargo, tengo problemas para encontrar buenas palabras clave / términos de búsqueda para el tema.
maximum-likelihood
references
survival
censoring
exponential-family
Buen chico mike
fuente
fuente
Respuestas:
Todavía puede estimar los parámetros utilizando la probabilidad directamente. Deje que las observaciones sean con la distribución exponencial con tasa λ > 0 y desconocida. La función de densidad es f ( x ; λ ) = λ e - λ x , función de distribución acumulativa F ( x ; λ ) = 1 - e - λ x y función de cola G ( x ; λX1, ... , xnorte λ > 0 F( x ; λ ) = λ e- λ x F( x ; λ ) = 1 - e- λ x . Suponga que las primeras r observaciones se observan completamente, mientras que para x r + 1 , ... , x n solo sabemos que x j > t j para algunas constantes positivas conocidas t j . Como siempre, la probabilidad es la "probabilidad de los datos observados", para las observaciones censuradas, que viene dada por P ( X j > t jG ( x ; λ ) = 1 - F( x ; λ ) = e- λ x r Xr + 1, ... , xnorte Xj> tj tj , entonces la función de verosimilitud completa es
L ( λ ) = r ∏ i = 1 f ( x i ; λ ) ⋅ n ∏ i = r + 1 G ( t j ; λ )
La función de verosimilitud se convierte en
l ( λ ) = r log λ 1 + ⋯ + x r + t r + 1PAG( Xj> tj) = G ( tj; λ )
Pero, en cualquier caso, la conclusión real de los datos en ese caso es que deberíamos esperar más tiempo hasta que tengamos algunos eventos ...
fuente