Tengo una muestra de datos que se generó a partir de una variable aleatoria continua X. Y a partir del histograma que dibujo usando R, supongo que tal vez la distribución de X obedece a una cierta distribución Gamma. Pero no conozco los parámetros exactos de esta distribución Gamma.
Mi pregunta es cómo probar si la distribución de X pertenece a una familia de distribución Gamma. Existen algunas pruebas de bondad de ajuste, como la prueba de Kolmogorov-Smirnov, la prueba de Anderson-Darling, etc., pero una de las restricciones al usar estas pruebas es que los parámetros de la distribución teórica deben conocerse de antemano. ¿Alguien podría decirme cómo resolver este problema?
Respuestas:
Creo que la pregunta pide una prueba estadística precisa, no una comparación de histograma. Cuando se usa la prueba de Kolmogorov-Smirnov con parámetros estimados , la distribución de las estadísticas de prueba bajo nulo depende de la distribución probada, en oposición al caso sin parámetro estimado. Por ejemplo, usando (en R)
lleva a
mientras nos ponemos
para la misma muestra x. El nivel de significancia o el valor p, por lo tanto, debe determinarse mediante la simulación de Monte Carlo bajo nulo, produciendo la distribución de las estadísticas de Kolmogorov-Smirnov a partir de muestras simuladas bajo la distribución estimada (con una ligera aproximación en el resultado dado que la muestra observada proviene de otra distribución, incluso debajo de la nula).
fuente
Calcule los MLE de los parámetros asumiendo una distribución gamma para sus datos y compare la densidad teórica con el histograma de sus datos. Si los dos son muy diferentes, la distribución gamma es una mala aproximación de sus datos. Para una prueba formal, podría calcular, por ejemplo, el estadístico de prueba de Kolmogorov-Smirnoff que compara la distribución gamma de mejor ajuste con la distribución empírica y prueba de significación.
fuente