Después de un reciente voto negativo, he estado tratando de verificar mi comprensión de la prueba de Pearson Chi Squared. Usualmente uso la estadística de chi cuadrado (o estadística de chi cuadrado reducido) para ajustar o verificar el ajuste resultante. En este caso, la varianza no suele ser el número esperado de conteos en una tabla o histograma, sino alguna varianza determinada experimentalmente. De cualquier manera, siempre tuve la impresión de que la prueba todavía usaba la normalidad asintótica del PDF multinomial (es decir, mi estadística de prueba es
y es asintóticamente multinormal donde es la matriz de covarianza). Por lo tanto, tiene una distribución chi-cuadrado dada grande, por lo que el uso del número esperado de recuentos como el denominador en la estadística se vuelve válido para grande . Es posible que esto solo sea cierto para los histogramas, no he analizado una pequeña tabla de datos en años.
¿Hay un argumento más sutil que me estoy perdiendo? Me interesaría una referencia, o incluso mejor una breve explicación. (Aunque es posible que me haya votado por omitir la palabra asintótica, lo que reconozco es bastante importante).
fuente
Respuestas:
Una prueba de Chi-cuadrado está diseñada para analizar datos categóricos. Eso significa que los datos han sido contados y divididos en categorías. No funcionará con datos paramétricos o continuos. Por lo tanto, no funciona para determinar el ajuste resultante en cada instancia.
Fuente: http://www.ling.upenn.edu/~clight/chisquared.htm
fuente