Considere el siguiente código y salida:
par(mfrow=c(3,2))
# generate random data from weibull distribution
x = rweibull(20, 8, 2)
# Quantile-Quantile Plot for different distributions
qqPlot(x, "log-normal")
qqPlot(x, "normal")
qqPlot(x, "exponential", DB = TRUE)
qqPlot(x, "cauchy")
qqPlot(x, "weibull")
qqPlot(x, "logistic")
Parece que el gráfico QQ para log-normal es casi el mismo que el gráfico QQ para weibull. ¿Cómo podemos distinguirlos? Además, si los puntos están dentro de la región definida por las dos líneas negras externas, ¿eso indica que siguen la distribución especificada?
library(car)
en su código para que sea más fácil de seguir para las personas. En general, es posible que también desee configurar la semilla (por ejemplo,set.seed(1)
) para que el ejemplo sea reproducible, de modo que cualquiera pueda obtener exactamente los mismos puntos de datos que ha obtenido, aunque probablemente no sea tan importante aquí.Respuestas:
Hay un par de cosas que decir aquí:
fuente
Si.
Con ese tamaño de muestra, es probable que no pueda.
No. Solo indica que no puede distinguir la distribución de los datos como diferente de esa distribución. Es falta de evidencia de una diferencia, no evidencia de falta de diferencia.
Puede estar casi seguro de que los datos provienen de una distribución que no es ninguna de las que ha considerado (¿por qué serían exactamente de cualquiera de ellos?).
fuente