Una pregunta para principiantes sobre el residuo de Pearson en el contexto de la prueba de chi-cuadrado para la bondad de ajuste:
Además de la estadística de prueba, la chisq.test
función de R informa el residuo de Pearson:
(obs - exp) / sqrt(exp)
Entiendo por qué mirar la diferencia en bruto entre los valores observados y esperados no es tan informativo, ya que una muestra más pequeña dará como resultado una diferencia más pequeña. Sin embargo, me gustaría saber más sobre el efecto del denominador: ¿por qué dividir por la raíz del valor esperado? ¿Es este un residuo 'estandarizado'?
chi-squared
goodness-of-fit
residuals
Iain Dillingham
fuente
fuente
stdres
para residuos estandarizados.chisq.test
también calcula elstdres
componente.Respuestas:
Una vez que impone un recuento total de celdas para la tabla de contingencia, o un recuento de filas o columnas, las distribuciones condicionales resultantes de los recuentos de celdas se vuelven multinomiales. En cualquier caso, para una distribución de Poisson tenemosE(Xi,j)=V(Xi,j)=μi,j , por lo que el recuento de células estandarizado es:
Entonces, lo que está viendo en la fórmula sobre la que está preguntando es el recuento de células estandarizado, bajo el supuesto de que los recuentos de células tienen una distribución de Poisson (incondicional).
A partir de aquí, es común probar la independencia de la variable de fila y columna en los datos, y en este caso puede usar una estadística de prueba que observe la suma de cuadrados de los valores anteriores (que es equivalente a la norma al cuadrado del vector de valores estandarizados). La prueba de chi cuadrado proporciona un valor p para este tipo de prueba basado en una aproximación de muestra grande a la distribución nula del estadístico de prueba. Por lo general, se aplica en casos donde ninguno de los recuentos de ventas es demasiado pequeño.
fuente
En el contexto de la bondad de ajuste, puede consultar este http://www.stat.yale.edu/Courses/1997-98/101/chigf.htm .
Si desea saber cómo llegó allí el denominador, tendrá que ver el chi-cuadrado aquí como una aproximación normal al binomio, para empezar, que luego puede extenderse a multinomiales.
fuente