¿Cuál es la diferencia entre gráficos de probabilidad, gráficos de PP y gráficos de QQ cuando se trata de analizar una distribución ajustada a los datos?
39
¿Cuál es la diferencia entre gráficos de probabilidad, gráficos de PP y gráficos de QQ cuando se trata de analizar una distribución ajustada a los datos?
Respuestas:
Como señala @ vector07 , la gráfica de probabilidad es la categoría más abstracta de la cual las gráficas pp y las gráficas qq son miembros. Por lo tanto, discutiré la distinción entre los dos últimos. La mejor manera de comprender las diferencias es pensar en cómo se construyen, y comprender que necesita reconocer la diferencia entre los cuantiles de una distribución y la proporción de la distribución por la que ha pasado cuando alcanza un cuantil determinado. Puede ver la relación entre estos trazando la función de distribución acumulativa (CDF) de una distribución. Por ejemplo, considere la distribución normal estándar:
Vemos que aproximadamente el 68% del eje y (región entre líneas rojas) corresponde a 1/3 del eje x (región entre líneas azules). Eso significa que cuando usamos la proporción de la distribución que hemos pasado para evaluar la coincidencia entre dos distribuciones (es decir, usamos un diagrama de pp), obtendremos mucha resolución en el centro de las distribuciones, pero menos en las colas Por otro lado, cuando usamos los cuantiles para evaluar la coincidencia entre dos distribuciones (es decir, usamos un diagrama qq), obtendremos una resolución muy buena en las colas, pero menos en el centro. (Debido a que los analistas de datos suelen estar más preocupados por las colas de una distribución, lo que tendrá más efecto en la inferencia, por ejemplo, los gráficos qq son mucho más comunes que los gráficos pp).
Para ver estos hechos en acción, recorreré la construcción de un diagrama de pp y un diagrama de qq. (También paso por la construcción de un diagrama qq verbalmente / más lentamente aquí: el diagrama QQ no coincide con el histograma ). No sé si usa R, pero espero que se explique por sí mismo:
Desafortunadamente, estas gráficas no son muy distintivas, porque hay pocos datos y estamos comparando una distribución teórica normal con la distribución teórica correcta, por lo que no hay nada especial que ver ni en el centro ni en las colas de la distribución. Para demostrar mejor estas diferencias, trazo una distribución t (cola gruesa) con 4 grados de libertad, y una distribución bimodal a continuación. Las colas gruesas son mucho más distintivas en la gráfica qq, mientras que la bimodalidad es más distintiva en la gráfica pp.
fuente
Aquí hay una definición de v8doc.sas.com :
En el texto, también mencionan:
Referencia :
SAS Institute Inc., SAS OnlineDoc®, Versión 8, Cary, NC: SAS Institute Inc., 1999
fuente