Estimación de parámetros de distribución exponencial con muestreo sesgado

8

Quiero calcular el parámetro de la distribución exponencial partir de una población de muestra sacada de esta distribución en condiciones sesgadas. Hasta donde sé, para una muestra de n valores, el estimador habitual es . Sin embargo, mi muestra está sesgada de la siguiente manera:λeλxλ^=nxi

De una población completa de m elementos extraídos de la distribución exponencial, solo se conocen los n elementos más pequeños. ¿Cómo puedo estimar el parámetro en este escenario?λ

Un poco más formalmente, si son muestras de iid extraídas de , de modo que para cada tenemos , entonces ¿Cómo puedo estimar del conjunto donde .{x1,x2,x3,...,xm}eλxi<jxixjλ{x1,x2,x3,...,xn}n<m

¡Muchas gracias!

Miguel

Miguel
fuente
1
¿Conoces el valor de m?
jbowman
3
Esto es censura de tipo II ( en.wikipedia.org/wiki/Censoring_%28statistics%29 ). Ahora, se puede demostrar que la probabilidad habitual en el análisis de supervivencia también es válida para un mecanismo de censura de tipo II.
ocram
1
Los roles de m y nparecen intercambiarse a mitad de camino a través de esta respuesta.
cardenal
Gracias tienes razon. Arreglé los roles de myn en la declaración del problema.
Michael

Respuestas:

8

El estimador de máxima verosimilitud para el parámetro de la distribución exponencial bajo censura tipo II se puede derivar de la siguiente manera. Supongo que el tamaño de la muestra esmde los cuales n<m más pequeños se observan y la mn los más grandes no son observados (pero se sabe que existen)

Supongamos (por simplicidad de notación) que lo observado xi están ordenados: 0x1x2xn. Entonces la densidad de probabilidad conjunta dex1,,xn es:

f(x1,,xn)=m!λn(mn)!exp{λi=1nxi}exp{λ(mn)xn}

donde el primer exponencial se relaciona con las probabilidades de la n observado xi y el segundo a las probabilidades de la mn desapercibido xi que son mayores que xn (que es solo 1 - el CDF en xn.) Reorganizar los términos conduce a:

f(x1,,xn)=m!λn(mn)!exp{λ[i=1n1xi+(mn+1)xn]}

(Tenga en cuenta que la suma corre a n1 ya que hay un "+1"en el coeficiente de xn.) Tomando el registro, luego la derivada wrt λ y así sucesivamente conduce al estimador de máxima verosimilitud:

λ^=n/[i=1n1xi+(mn+1)xn]

jbowman
fuente
1
Buena respuesta. ¿Cambiaste?m y nen comparación con la pregunta por accidente?
Neil G
2
@NeilG - ¡gracias! Acabo de notar que el OP cambió de "de una población completa dem los elementos se dibujan ... solo el n los más pequeños son conocidos "en el texto para m<nal final. Aclararé qué notación estoy usando en una edición ...
jbowman
2

Esto vincula la respuesta de @jbowman a mi comentario. Es decir, bajo supuestos de trabajo comunes, uno puede usar la 'probabilidad de supervivencia estándar' bajo la censura de tipo II.

> #------seed------
> set.seed(1907)
> #----------------
> 
> #------some data------
> t <- sort(rexp(n=20, rate=2))        #true sample
> t[16:20] <- t[15]                    #observed sample
> delta <- c(rep(1, 15), rep(0, 5))    #censoring indicator
> data <- data.frame(t, delta)         #observed data
> #---------------------
> 
> #-----using @jbowman's formula------
> 15 / (sum(t[1:14]) + (5 + 1)*t[15])
[1] 2.131323
> #-----------------------------------
> 
> #------using the usual survival likelihood------
> library(survival)
> fit <- survreg(Surv(t, delta)~1, dist="exponential", data=data)
> exp(-fit$coef)
(Intercept) 
   2.131323 
> #-----------------------------------------------

PS1: Tenga en cuenta que esto no está restringido a la distribución exponencial.

PS2: Los detalles se pueden encontrar en la Sección 2.2 del libro de Lawless .

ocram
fuente
1

Asumiendo n se conoce, se puede obtener una estimación a través de

Φ(xk)=1eλxk(k/n) dónde xk, 0<k<m, se refiere a k'valor más pequeño en su conjunto de datos reducido.

La lógica es: si tuviera todo el conjunto de n muestras, podrías construir el CDF empírico, Φ, de esta muestra. Entonces si tomaste el artículok de esta matriz ordenada, correspondería al valor de CDF k/n. En muchos casos,k=n/2 Es una opción útil.

Dave
fuente