Tengo una muestra que es un vector con 220 números. Aquí hay un enlace a un histograma de mis datos. . Y deseo verificar si mis datos se ajustan a una distribución de Pareto, pero no quiero ver gráficos QQ con esa distribución, pero necesito una respuesta exacta con el valor p en R, como la prueba de normalidad de Anderson-Darling ( ad.test
) . ¿Cómo podría hacer eso? Por favor se tan especifico como puedas.
r
distributions
pareto-distribution
fuerte
fuente
fuente
Respuestas:
(PS) En primer lugar, creo que Glen_b tiene razón en sus comentarios anteriores sobre la utilidad de tal prueba: los datos reales seguramente no están exactamente distribuidos por Pareto, y para la mayoría de las aplicaciones prácticas la pregunta sería "¿qué tan buena es la aproximación de Pareto?" - y el gráfico QQ es una buena manera de mostrar la calidad de tal aproximación.
De cualquier manera, puede hacer su prueba con la estadística de Kolmogorov-Smirnov, después de estimar los parámetros por máxima probabilidad. La estimación de este parámetro impide utilizar elpags -value de
ks.test
, por lo que puede hacer bootstrap paramétrico para estimarlo. Como Glen_b dice en el comentario, esto se puede conectar a la prueba de Lilliefors .Aquí hay algunas líneas de código R.
Primero defina las funciones básicas para manejar las distribuciones de Pareto.
La siguiente función calcula el MLE de los parámetros (justificaciones en Wikipedia ).
Y estas funciones calculan la estadística KS, y usan bootstrap paramétrico para estimar elpags -valor.
Ahora, por ejemplo, una muestra proveniente de una distribución de Pareto:
... y de unχ2(2) :
Tenga en cuenta que no afirmo que esta prueba sea imparcial: cuando la muestra es pequeña, puede existir algún sesgo. El bootstrap paramétrico no tiene muy en cuenta la incertidumbre en la estimación del parámetro (piense en lo que sucedería al usar esta estrategia para probar ingenuamente si la media de alguna variable normal con varianza desconocida es cero).
PS Wikipedia dice algunas palabras sobre esto. Aquí hay otras dos preguntas para las cuales se sugirió una estrategia similar: prueba de bondad de ajuste para una mezcla , prueba de bondad de ajuste para una distribución gamma .
fuente