Tener, digamos, los siguientes datos:
8232302 684531 116857 89724 82267 75988 63871
23718 1696 436 439 248 235
Desea una forma simple de ajustar esto (y varios otros conjuntos de datos) a una distribución de Pareto. Idealmente, generaría los valores teóricos coincidentes, menos idealmente los parámetros.
r
pareto-distribution
Felix
fuente
fuente
Respuestas:
Bueno, si tiene una muestra de una distribución pareto con los parámetros y (donde es el parámetro de límite inferior y es el parámetro de forma), la probabilidad logarítmica de eso muestra es: m > 0 α > 0 m αX1,...,Xn m>0 α>0 m α
Este es un aumento monotónico en , por lo que el maximizador es el valor más grande que es consistente con los datos observados. Como el parámetro define el límite inferior del soporte para la distribución de Pareto, lo óptimo esmm m
que no depende de . Luego, usando trucos de cálculo ordinarios, el MLE para debe satisfacerα α
un poco de álgebra simple nos dice que el MLE de esα
En muchos sentidos importantes (por ejemplo, eficiencia asintótica óptima en el sentido de que alcanza el límite inferior de Cramer-Rao), esta es la mejor manera de ajustar los datos a una distribución de Pareto. El código de R a continuación calcula el MLE para un conjunto de datos dado,
X
.Editar: según el comentario de @cardinal e I a continuación, también podemos observar que es el recíproco de la media muestral de los , que suceden a tener una distribución exponencial. Por lo tanto, si tenemos acceso a un software que puede ajustarse a una distribución exponencial (lo que es más probable, ya que parece surgir en muchos problemas estadísticos), entonces se puede ajustar una distribución de Pareto transformando el conjunto de datos de esta manera y ajustándolo a una distribución exponencial en la escala transformada.α^ log(Xi/m^)
fuente
Puede usar la
fitdist
función proporcionada en elfitdistrplus
paquete:fuente
library(fitdistrplus)
?library(actuar)
es necesaria para que esto funcione.