Aproximación de para una distribución discreta

11

¿Cuál es la mejor manera de aproximar para dos enteros dados cuando conoce la media , la varianza , la asimetría y el exceso de curtosis de una distribución discreta , y de las medidas (distintas de cero) de las formas y que una aproximación normal no es apropiada?Pr[nXm]m,nμσ2γ1γ2Xγ1γ2

Normalmente, usaría una aproximación normal con corrección de enteros ...

Pr[(n½)X(m+½)]=Pr[(n½)μσZ(m+½)μσ]=Φ((m+½)μσ)Φ((n½)μσ)

... si la asimetría y el exceso de curtosis fueron (más cercanos a) 0, pero ese no es el caso aquí.

Tengo que realizar múltiples aproximaciones para diferentes distribuciones discretas con diferentes valores de y . Por lo tanto, estoy interesado en averiguar si existe un procedimiento establecido que use y para seleccionar una mejor aproximación que la aproximación normal.γ1γ2γ1γ2

kjetil b halvorsen
fuente

Respuestas:

4

Esta es una pregunta interesante, que realmente no tiene una buena solución. Hay algunas formas diferentes de abordar este problema.

  1. Suponga una distribución subyacente y momentos de coincidencia, como se sugiere en las respuestas de @ivant y @onestop. Una desventaja es que la generalización multivariada puede no estar clara.

  2. Aproximaciones de Saddlepoint. En este papel:

    Gillespie, CS y Renshaw, E. Una aproximación de punto de silla mejorada. Biociencias Matemáticas , 2007.

    Buscamos recuperar un pdf / pmf cuando se nos da solo los primeros momentos. Descubrimos que este enfoque funciona cuando la asimetría no es demasiado grande.

  3. Expansiones de Laguerre:

    Mustapha, H. y Dimitrakopoulosa, R. Expansiones generalizadas de Laguerre de densidades de probabilidad multivariadas con momentos . Computadoras y Matemáticas con Aplicaciones , 2010.

    Los resultados en este documento parecen más prometedores, pero no los he codificado.

csgillespie
fuente
4

Ajustar una distribución a los datos usando los primeros cuatro momentos es exactamente para lo que Karl Pearson ideó la familia de distribuciones de probabilidad continua de Pearson (la probabilidad máxima es mucho más popular en estos días, por supuesto). Debe ser sencillo para el miembro relevante de esa familia, luego use el mismo tipo de corrección de continuidad que le proporcionó anteriormente para la distribución normal.

¿Supongo que debe tener un tamaño de muestra realmente enorme? De lo contrario, las estimaciones muestrales de asimetría y especialmente la curtosis a menudo son irremediablemente imprecisas, además de ser muy sensibles a los valores atípicos. En cualquier caso, recomiendo que eche un vistazo a los momentos L como una alternativa que tiene varias ventajas sobre los momentos normales ventajoso para ajustar distribuciones a datos.

una parada
fuente
2

Podría intentar utilizar una distribución normal sesgada y ver si el exceso de curtosis para sus conjuntos de datos particulares está suficientemente cerca del exceso de curtosis de la distribución para un sesgo dado. Si es así, puede usar el cdf de distribución normal sesgada para estimar la probabilidad. De lo contrario, tendría que llegar a una transformación al pdf normal / sesgado similar al utilizado para la distribución normal sesgada, lo que le daría control sobre el sesgo y la curtosis excesiva.

Ivan Tarasov
fuente