Dado un conjunto de datos:
x <- c(4.9958942,5.9730174,9.8642732,11.5609671,10.1178216,6.6279774,9.2441754,9.9419299,13.4710469,6.0601435,8.2095239,7.9456672,12.7039825,7.4197810,9.5928275,8.2267352,2.8314614,11.5653497,6.0828073,11.3926117,10.5403929,14.9751607,11.7647580,8.2867261,10.0291522,7.7132033,6.3337642,14.6066222,11.3436587,11.2717791,10.8818323,8.0320657,6.7354041,9.1871676,13.4381778,7.4353197,8.9210043,10.2010750,11.9442048,11.0081195,4.3369520,13.2562675,15.9945674,8.7528248,14.4948086,14.3577443,6.7438382,9.1434984,15.4599419,13.1424011,7.0481925,7.4823108,10.5743730,6.4166006,11.8225244,8.9388744,10.3698150,10.3965596,13.5226492,16.0069239,6.1139247,11.0838351,9.1659242,7.9896031,10.7282936,14.2666492,13.6478802,10.6248561,15.3834373,11.5096033,14.5806570,10.7648690,5.3407430,7.7535042,7.1942866,9.8867927,12.7413156,10.8127809,8.1726772,8.3965665)
.. Me gustaría determinar la distribución de probabilidad más adecuada (gamma, beta, normal, exponencial, poisson, chi-cuadrado, etc.) con una estimación de los parámetros. Ya estoy al tanto de la pregunta en el siguiente enlace, donde se proporciona una solución usando R: /programming/2661402/given-a-set-of-random-numbers-drawn-from-a- distribución-univariada-continua-f la mejor solución propuesta es la siguiente:
> library(MASS)
> fitdistr(x, 't')$loglik #$
> fitdistr(x, 'normal')$loglik #$
> fitdistr(x, 'logistic')$loglik #$
> fitdistr(x, 'weibull')$loglik #$
> fitdistr(x, 'gamma')$loglik #$
> fitdistr(x, 'lognormal')$loglik #$
> fitdistr(x, 'exponential')$loglik #$
Y se selecciona la distribución con el valor loglik más pequeño. Sin embargo, otras distribuciones como la distribución beta requieren la especificación de algunos parámetros de adición en la función fitdistr ():
fitdistr(x, 'beta', list(shape1 = some value, shape2= some value)).
Dado que estoy tratando de determinar la mejor distribución sin ninguna información previa, no sé cuál puede ser el valor de los parámetros para cada distribución. ¿Hay alguna otra solución que tenga en cuenta este requisito? no tiene que estar en R.
fuente
He encontrado una función que responde a mi pregunta usando matlab. Se puede encontrar en este enlace: http://www.mathworks.com/matlabcentral/fileexchange/34943
Tomo un vector de datos como entrada
y devuelve la siguiente información para la mejor distribución de ajuste:
fuente