Estoy tratando de entender la lógica detrás de la prueba de chi-cuadrado.
La prueba de Chi-cuadrado es . χ2luego se compara con una distribución de Chi-cuadrado para encontrar un valor p para rechazar o no la hipótesis nula. H0: las observaciones provienen de la distribución que utilizamos para crear nuestros valores esperados. Por ejemplo, podríamos probar si la probabilidad de obtenciónviene dada porpcomo esperamos. Así que tapa 100 veces y encontramosnHy1-nH. Queremos comparar nuestro hallazgo con lo que se espera (100⋅phead
Heads
tails
). También podríamos usar una distribución binomial, pero no es el punto de la pregunta ... La pregunta es:
¿Puede explicar por qué, bajo la hipótesis nula, sigue una distribución chi-cuadrado?
Todo lo que sé sobre la distribución de Chi-cuadrado es que la distribución de Chi-cuadrado de grado es la suma de k la distribución normal estándar cuadrado.
Respuestas:
Sin embargo, es nuestro punto de partida incluso para su pregunta real. Lo cubriré de manera informal.
Consideremos con el caso binomial de manera más general:
Supongamos y p son tales que Y es bien aproximada por una normal con la misma varianza media y (algunos requisitos típicos son de min ( n p , n ( 1 - p ) ) no es pequeño, o que n p ( 1 - p )norte pag Y min ( n p , n ( 1 - p ) ) n p ( 1 - p ) no es pequeño).
Que es solo la estadística de chi-cuadrado para el caso binomial.
Entonces, en ese caso, la estadística de chi-cuadrado debe tener la distribución del cuadrado de una variable aleatoria normal normal (aproximadamente).
fuente