Quiero calcular el parámetro de la distribución exponencial partir de una población de muestra sacada de esta distribución en condiciones sesgadas. Hasta donde sé, para una muestra de n valores, el estimador habitual es . Sin embargo, mi muestra está sesgada de la siguiente manera:
De una población completa de m elementos extraídos de la distribución exponencial, solo se conocen los n elementos más pequeños. ¿Cómo puedo estimar el parámetro en este escenario?
Un poco más formalmente, si son muestras de iid extraídas de , de modo que para cada tenemos , entonces ¿Cómo puedo estimar del conjunto donde .
¡Muchas gracias!
Miguel
Respuestas:
El estimador de máxima verosimilitud para el parámetro de la distribución exponencial bajo censura tipo II se puede derivar de la siguiente manera. Supongo que el tamaño de la muestra esmetro de los cuales n < m más pequeños se observan y la m - n los más grandes no son observados (pero se sabe que existen)
Supongamos (por simplicidad de notación) que lo observadoXyo están ordenados: 0 ≤X1≤X2≤ ⋯ ≤Xnorte . Entonces la densidad de probabilidad conjunta deX1, ... ,Xnorte es:
donde el primer exponencial se relaciona con las probabilidades de lanorte observado Xyo y el segundo a las probabilidades de la m - n desapercibido Xyo que son mayores que Xnorte (que es solo 1 - el CDF en Xnorte .) Reorganizar los términos conduce a:
(Tenga en cuenta que la suma corre an - 1 ya que hay un "+ 1 "en el coeficiente de Xnorte .) Tomando el registro, luego la derivada wrt λ y así sucesivamente conduce al estimador de máxima verosimilitud:
fuente
Esto vincula la respuesta de @jbowman a mi comentario. Es decir, bajo supuestos de trabajo comunes, uno puede usar la 'probabilidad de supervivencia estándar' bajo la censura de tipo II.
PS1: Tenga en cuenta que esto no está restringido a la distribución exponencial.
PS2: Los detalles se pueden encontrar en la Sección 2.2 del libro de Lawless .
fuente
Asumiendon se conoce, se puede obtener una estimación a través de
La lógica es: si tuviera todo el conjunto den muestras, podrías construir el CDF empírico, Φ , de esta muestra. Entonces si tomaste el artículok de esta matriz ordenada, correspondería al valor de CDF k/n . En muchos casos,k=n/2 Es una opción útil.
fuente