Comprender la prueba de Chi-cuadrado y la distribución de Chi-cuadrado

13

Estoy tratando de entender la lógica detrás de la prueba de chi-cuadrado.

La prueba de Chi-cuadrado es . χ2luego se compara con una distribución de Chi-cuadrado para encontrar un valor p para rechazar o no la hipótesis nula. H0: las observaciones provienen de la distribución que utilizamos para crear nuestros valores esperados. Por ejemplo, podríamos probar si la probabilidad de obtenciónviene dada porpcomo esperamos. Así que tapa 100 veces y encontramosnHy1-nH. Queremos comparar nuestro hallazgo con lo que se espera (100pχ2=(osis-miXpag)2miXpagχ2H0 0headpagnorteH Heads1-norteH tails100pag ). También podríamos usar una distribución binomial, pero no es el punto de la pregunta ... La pregunta es:

¿Puede explicar por qué, bajo la hipótesis nula, (osis-miXpag)2miXpag sigue una distribución chi-cuadrado?

Todo lo que sé sobre la distribución de Chi-cuadrado es que la distribución de Chi-cuadrado de grado es la suma de kkk la distribución normal estándar cuadrado.

Remi.b
fuente
2
No lo hace: esta es una aproximación. (Mucho) más sobre esto aparece en el hilo en stats.stackexchange.com/questions/16921/… .
whuber
Esto puede ser de interés Karl Pearson y la prueba de Chi-cuadrado, (Placket, 1983) {pdf}
Avraham
Una pregunta relacionada sobre por qué la distribución de chi-cuadrado se usa para las pruebas de bondad de ajuste, aunque no es un duplicado: stats.stackexchange.com/questions/125312/…
Silverfish

Respuestas:

12

También podríamos usar una distribución binomial, pero no es el punto de la pregunta ...

Sin embargo, es nuestro punto de partida incluso para su pregunta real. Lo cubriré de manera informal.

Consideremos con el caso binomial de manera más general:

YCompartimiento(norte,pag)

Supongamos y p son tales que Y es bien aproximada por una normal con la misma varianza media y (algunos requisitos típicos son de min ( n p , n ( 1 - p ) ) no es pequeño, o que n p ( 1 - p )nortepagYmin(nortepag,norte(1-pag))nortepag(1-pag) no es pequeño).

(Y-mi(Y))2/ /Var(Y)χ12Y es el número de éxitos.

mi(Y)=nortepagVar(Y)=nortepag(1-pag)

nortepagH0 0 No hacemos ninguna estimación).

(Y-nortepag)2/ /nortepag(1-pag)χ12 .

(Y-nortepag)2=[(norte-Y)-norte(1-pag)]21pag+11-pag=1pag(1-pag)

(Y-nortepag)2nortepag(1-pag)=(Y-nortepag)2nortepag+(Y-nortepag)2norte(1-pag)=(Y-nortepag)2nortepag+[(norte-Y)-norte(1-pag)]2norte(1-pag)=(OS-miS)2miS+(OF-miF)2miF

Que es solo la estadística de chi-cuadrado para el caso binomial.

Entonces, en ese caso, la estadística de chi-cuadrado debe tener la distribución del cuadrado de una variable aleatoria normal normal (aproximadamente).

Glen_b -Reinstate a Monica
fuente