QQ interpretación de la trama

Considere el siguiente código y salida:

  par(mfrow=c(3,2))
  # generate random data from weibull distribution
  x = rweibull(20, 8, 2)
  # Quantile-Quantile Plot for different distributions
  qqPlot(x, "log-normal")
  qqPlot(x, "normal")
  qqPlot(x, "exponential", DB = TRUE)
  qqPlot(x, "cauchy")
  qqPlot(x, "weibull")
  qqPlot(x, "logistic")

ingrese la descripción de la imagen aquí

Parece que el gráfico QQ para log-normal es casi el mismo que el gráfico QQ para weibull. ¿Cómo podemos distinguirlos? Además, si los puntos están dentro de la región definida por las dos líneas negras externas, ¿eso indica que siguen la distribución especificada?

r data-visualization interpretation qq-plot protón
fuente

Creo que estás usando el paquete del auto , ¿no? Si es así, debe incluir la declaración library(car)en su código para que sea más fácil de seguir para las personas. En general, es posible que también desee configurar la semilla (por ejemplo, set.seed(1)) para que el ejemplo sea reproducible, de modo que cualquiera pueda obtener exactamente los mismos puntos de datos que ha obtenido, aunque probablemente no sea tan importante aquí.

gung - Restablece a Monica

Esto no se ejecutará en mi computadora como está escrito. Por ejemplo, qqPlot del paquete del automóvil quiere la norma para normal y lnorm para log-normal. ¿Qué me estoy perdiendo?

Tom

@ Tom, me equivoqué sobre el paquete. Evidentemente, es el paquete qualityTools . Además, el ejemplo parece ser tomado de aquí .

gung - Restablecer Monica

Una alternativa interesante es el gráfico de Cullen y Frey, vea stats.stackexchange.com/questions/243973/… para ver un ejemplo

kjetil b halvorsen el

Respuestas:

Hay un par de cosas que decir aquí:

la forma del CDF para el log-normal es lo suficientemente similar a la forma del CDF del Weibull para hacerlos más difíciles de distinguir que el nivel de similitud entre el Weibull y los demás.
Las líneas negras externas forman una banda de confianza . El uso de la banda de confianza en la inferencia es la misma que cualquier otra forma estándar de inferencia estadística frecuente. Es decir, cuando los valores caen dentro de la banda, no podemos rechazar la hipótesis nula de que la distribución propuesta es la correcta. Esto no es lo mismo que decir que sabemos que la distribución propuesta es la correcta. (Tenga en cuenta que este es un gran ejemplo de lo que discutí en otra respuesta aquí de una situación en la que la perspectiva de los pescadores en la prueba de hipótesis sería preferible a la de Neyman-Pearson).
$N$

gung - Restablece a Monica
fuente

¿Hay formas de examinar las distribuciones para tamaños de muestra pequeños?

protón

de hecho, parece que los puntos se encuentran en las bandas de confianza para todas las distribuciones. ¿Entonces no podemos distinguir las distribuciones?

protón

n = 20

$n=20$

\approx 5 %

$\approx 5\%$

+1 en el tamaño de muestra pequeño. Usar 300 muestras ayudaría a distinguir mucho las cosas. Protón: No, realmente no se pueden distinguir las distribuciones con una muestra pequeña. ¿Como pudiste? Es como tratar de identificar una cara con 20 píxeles.

Wayne

Parece que el gráfico QQ para log-normal es casi el mismo que el gráfico QQ para weibull.

Si.

¿Cómo podemos distinguirlos?

Con ese tamaño de muestra, es probable que no pueda.

Además, si los puntos están dentro de la región definida por las dos líneas negras externas, ¿eso indica que siguen la distribución especificada?

No. Solo indica que no puede distinguir la distribución de los datos como diferente de esa distribución. Es falta de evidencia de una diferencia, no evidencia de falta de diferencia.

Puede estar casi seguro de que los datos provienen de una distribución que no es ninguna de las que ha considerado (¿por qué serían exactamente de cualquiera de ellos?).

Glen_b -Reinstate a Monica
fuente

Como la frase: "Es la falta de evidencia de una diferencia, no la evidencia de una falta de diferencia".

jlandercy