Estimación de densidad con una distribución truncada?

8

Tengo algunos datos que están claramente truncados a la izquierda. Deseo ajustarlo con una estimación de densidad que lo maneje de alguna manera en lugar de tratar de suavizarlo.

¿Qué métodos conocidos (como de costumbre, en R) pueden abordar esto?

Código de muestra:

set.seed(1341)
x <- c(runif(30, 0, 0.01), rnorm(100,3))
hist(x, br = 10, freq = F)
lines(density(x), col = 3, lwd = 3)

ingrese la descripción de la imagen aquí

Gracias :)

Tal Galili
fuente
66
Este es un buen ejemplo de algo que ocasionalmente se ha denominado "distribución lognormal delta" (donde el eje x se interpreta como logaritmos). Puede considerarlo como una mezcla de una distribución continua (que parece casi Normal, pero su identificación precisa depende de usted) y una distribución de puntos compatible cerca de 0. Un modelo de mezcla debería hacer un buen trabajo. En este caso particular, la separación entre el átomo cerca de 0 y el resto de los datos es tan buena que estaría bien simplemente eliminando los datos a la izquierda (menos de 0.5) y estimando la densidad del resto.
whuber
2
En algunos contextos, algo como esto podría llamarse una distribución Tweedie , en caso de que ayude a medida que explora esto.
cardenal
Cardenal: ¡gracias por la referencia! Whuber, estoy más interesado en la parte cercana a 0, por lo que la respuesta de Greg a continuación es excelente. Gracias a los dos.
Tal Galili

Respuestas:

6

El paquete logspline para R tiene la función oldlogspline que estimará las densidades utilizando una mezcla de datos observados y censurados.

Greg Snow
fuente
5

La función de densidad también tiene un fromparámetro para indicar el lado más a la izquierda "de la cuadrícula en la que se estima la densidad". Continuando con el ejemplo anterior:

lines(density(x, from = 0), col = 4, lwd = 3)

Sin embargo, como puede ver, esta es exactamente la misma distribución sin el fromparámetro anterior. Simplemente comienza desde 0, eso es todo.

Mike T
fuente