La declaración
La distribución muestral de la varianza muestral es una distribución chi-cuadrado con un grado de libertad igual a , donde n es el tamaño de la muestra (dado que la variable aleatoria de interés se distribuye normalmente).
Mi intuicion
Para mí tiene un sentido intuitivo 1) porque una prueba de chi-cuadrado parece una suma de cuadrados y 2) porque una distribución de Chi-cuadrado es solo una suma de distribución normal al cuadrado. Pero aún así, no lo entiendo bien.
Pregunta
¿Es cierto el enunciado? ¿Por qué?
Respuestas:
[Asumiré de la discusión en su pregunta que está feliz de aceptar como un hecho que si son variables aleatorias independientes N ( 0 , 1 ) distribuidas idénticamente , entonces ∑ k i = 1 Z 2 i ∼ χ 2 k .]Zi,i=1,2,…,k N(0,1) ∑ki=1Z2i∼χ2k
Formalmente, el resultado que necesita se deriva del teorema de Cochran . (Aunque se puede mostrar de otras maneras)
Menos formalmente, considere que si supiéramos la media de la población y estimáramos la varianza sobre ella (en lugar de sobre la media de la muestra): , entoncess 2 0 /σ2=1s20=1n∑ni=1(Xi−μ)2 , (Zi=(Xi-μ)/σ) que será1s20/σ2=1n∑ni=1(Xi−μσ)2=1n∑ni=1Z2i Zi=(Xi−μ)/σ veces aχ 2 n variable aleatoria.1n χ2n
El hecho de que se use la media de la muestra, en lugar de la media de la población ( ) hace que la suma de los cuadrados de las desviaciones sea menor, pero de tal manera que ∑ n i = 1 ( Z ∗ i ) 2Z∗i=(Xi−X¯)/σ (sobre el cual, ver el teorema de Cochran). Por lo tanto, en lugar de n s 2 0 / σ 2 ∼ χ 2 n ahora tenemos ( n - 1 ) s 2 / σ 2 ∼ χ 2 n - 1 .∑ni=1(Z∗i)2∼χ2n−1 ns20/σ2∼χ2n (n−1)s2/σ2∼χ2n−1
fuente