Estimación de la densidad del núcleo en distribuciones asimétricas.

10

Sean observaciones extraídas de una distribución de probabilidad desconocida (pero ciertamente asimétrica).{X1,...,Xnorte}

Me gustaría encontrar la distribución de probabilidad utilizando el enfoque KDE: Sin embargo, intenté usar un núcleo gaussiano, pero funcionó mal, ya que es simétrico. Por lo tanto, he visto que se han publicado algunos trabajos sobre los núcleos Gamma y Beta, aunque no entendí cómo operar con ellos.

F^(X)=1nortehyo=1norteK(X-Xyoh)

Mi pregunta es: ¿cómo manejar este caso asimétrico, suponiendo que el soporte de la distribución subyacente no esté en el intervalo ?[0 0,1]

Eleanore
fuente
44
En el caso de densidades cercanas a lognormal (que encuentro mucho en algunas aplicaciones particulares), simplemente me transformo (tomando registros) y luego hago KDE, y luego vuelvo a transformar el KDE (es necesario recordar el jacobiano al transformar la estimación de vuelta). Funciona bastante bien en ese caso.
Glen_b -Reinstale a Monica
@Glen_b ¿tiene alguna referencia o material donde se describe este método? (Calculando el KDE en una transformación de la variable original y luego transformando el KDE de nuevo)
boscovich
No es que yo sepa, estoy seguro de que existen, ya que es una idea bastante trivial y fácil de implementar. Es el tipo de cosas que esperaría que un estudiante de estadística pueda obtener. En la práctica funciona muy bien.
Glen_b -Reinstale a Monica
@glen_b gracias. Entonces, si tuviera que usarlo en un informe técnico / publicación, ¿cree que estaría bien no dar ninguna referencia?
boscovich
1
@guy Ciertamente es posible tener problemas, especialmente con algunas transformaciones y algunos tipos de datos. Las situaciones que he usado tienden a estar bastante cerca de lo normal, y allí el cambio en el ancho de banda que ves como un problema es exactamente lo que se necesita; funciona mucho mejor que KDE en los datos sin procesar. Según la descripción del OP, sonaba bastante similar, pero no es como si estuviera sugiriendo que era una panacea .
Glen_b -Reinstale a Monica

Respuestas:

5

En primer lugar, KDE con núcleos simétricos también puede funcionar muy bien cuando los datos son asimétricos. De lo contrario, sería completamente inútil en la práctica, en realidad.

En segundo lugar, ¿ha considerado reescalar sus datos para corregir la asimetría, si cree que esto está causando el problema? Por ejemplo, puede ser una buena idea intentar ir a , ya que se sabe que esto ayuda en muchos problemas.Iniciar sesión(X)

HA SALIDO - Anony-Mousse
fuente
Si cambia de escala log(x), ¿también necesita dar cuenta de un jacobiano?
DilithiumMatrix
0

Hmm Es posible que desee un ancho de kernel que cambie en función de la ubicación.

Si estuviera viendo el problema en eCDF, entonces podría intentar hacer que una pendiente numérica del CDF se relacione con el tamaño del Kernel.

Creo que si va a hacer una transformación de coordenadas, debe tener una idea bastante clara de los puntos de inicio y finalización. Si conoce bien la distribución de destino, entonces no necesita la aproximación del núcleo.

Estudiante
fuente
1
Muy fácilmente podría saber que mis vehículos recreativos no son negativos, pero todavía quieren un KDE.
chico