El diagrama qq se puede usar para visualizar cuán similares son dos distribuciones (por ejemplo, visualizar la similitud de una distribución con una distribución normal, pero también para comparar dos distribuciones de datos artibrary). ¿Hay alguna estadística que genere una medida numérica más objetiva que represente su similitud (preferiblemente en forma normalizada (0 <= x <= 1))? El coeficiente de Gini se usa, por ejemplo, en economía cuando se trabaja con curvas de Lorenz; ¿Hay algo para las parcelas QQ?
fuente
I recientemente utilizado la correlación entre la CDF empírica y la CDF equipada para cuantificar de bondad de ajuste, y me pregunto si este enfoque también podría ser útil en el caso actual, que como lo entiendo implica la comparación de dos conjuntos de datos empíricos. La interpolación podría ser necesaria si hay diferentes números de observaciones entre los conjuntos.
fuente
Diría que la forma más o menos canónica de comparar dos distribuciones sería una prueba de ji cuadrado. Sin embargo, la estadística no está normalizada, y depende de cómo elija los contenedores. El último punto puede verse, por supuesto, como una característica, no como un error: por ejemplo, elegir bins apropiadamente le permite buscar más de cerca la similitud en las colas que en el medio de las distribuciones.
fuente
Una medida bastante directa de la "cercanía" a la linealidad en un gráfico QQ sería una estadística de prueba de Shapiro-Francia (que está estrechamente relacionada con el Shapiro-Wilk más conocido y puede considerarse como una simple aproximación).
La estadística de Shapiro-Francia es la correlación al cuadrado entre los valores de datos ordenados y las estadísticas de orden normal esperadas (a veces etiquetadas como "cuantiles teóricos"), es decir, debe ser el cuadrado de la correlación que se ve en la gráfica, un aspecto bastante directo medida resumen
(El Shapiro-Wilk es similar pero tiene en cuenta las correlaciones entre las estadísticas de la orden; tiene una interpretación similar a la de Shapiro-Francia y es casi tan útil como un resumen de la gráfica QQ).
De cualquier manera, para un resumen de un solo número de lo que muestra la gráfica QQ, una de esas podría ser una forma adecuada de resumir la gráfica.
fuente