Tengo una situación en la que puedo estimar (los primeros) momentos de un conjunto de datos, y me gustaría usarlo para producir una estimación de la función de densidad.
Ya me encontré con la distribución de Pearson , pero me di cuenta de que solo se basa en los primeros 4 momentos (con algunas restricciones en las posibles combinaciones de momentos).
También entiendo que cualquier conjunto finito de momentos no es suficiente para "precisar" una distribución específica, cuando no se utilizan más suposiciones. Sin embargo, todavía me gustaría una clase de distribuciones más general (que no sea la familia de distribuciones Pearson). Mirando otras preguntas, no pude encontrar esa distribución (ver: aquí , aquí , aquí , aquí , aquí y aquí ).
¿Hay alguna familia de distribución generalizada ("simple") que pueda definirse para cualquier conjunto de momentos? (tal vez un conjunto de transformaciones que pueden tomar una distribución normal estándar y transformarla hasta que se confirme con todo el conjunto de momentos)k
(No me importa mucho si asumimos que los otros momentos son 0 o no)
Gracias.
ps: estaría feliz por un ejemplo extendido. Preferiblemente con un ejemplo de código R.
fuente
Respuestas:
Método 1: sistemas Pearson de orden superior
El sistema de Pearson se considera, por convención, la familia de soluciones a la ecuación diferencial:p(x)
donde los cuatro parámetros de Pearson se pueden expresar en términos de los primeros cuatro momentos de la población.(a,c0,c1,c2)
En lugar de basar el sistema de Pearson en la cuadrática , uno puede considerar el uso de polinomios de orden superior como la piedra angular. Entonces, por ejemplo, uno puede considerar un sistema de estilo Pearson basado en un polinomio cúbico. Esta será la familia de soluciones a la ecuación diferencial:c0+c1x+c2x2 p(x)
que produce la solución:
Resolví esto por diversión hace algún tiempo (teniendo el mismo tren de pensamiento que el OP): la derivación y la solución se dan en el Capítulo 5 de nuestro libro; Si está interesado, una descarga gratuita está disponible aquí:
http://www.mathstatica.com/book/bookcontents.html
Tenga en cuenta que mientras que la familia de Pearson de segundo orden (cuadrática) se puede expresar en términos de los primeros 4 momentos, la familia de estilo Pearson de tercer orden (cúbica) requiere los primeros 6 momentos.
Método 2: expansiones de Gram-Charlier
¿Momentos de población o momentos de muestra?
Para el sistema de estilo Pearson: si se conocen los momentos de la población, el uso de momentos más altos debería proporcionar un mejor ajuste sin ambigüedades. Sin embargo, si los datos observados son una muestra aleatoria extraída de la población, existe una compensación: un polinomio de orden superior implica que se requieren momentos de orden más altos, y las estimaciones de este último pueden ser poco confiables (tienen una alta varianza), a menos que el tamaño de la muestra sea 'grande'. En otras palabras, dados los datos de muestra, el ajuste usando momentos más altos puede volverse 'inestable' y producir resultados inferiores. Lo mismo es cierto para las expansiones de Gram-Charlier: agregar un término adicional en realidad puede producir un peor ajuste, por lo que se requiere un poco de cuidado.
fuente