Esta es una pregunta muy básica. ¿Por qué usamos una distribución de chi cuadrado? ¿Cuál es el significado de esta distribución? ¿Por qué es esta la distribución utilizada para crear un intervalo de confianza para la varianza?
Cada lugar en el que busco una explicación en Google solo presenta esto como un hecho, explicando cuándo usar chi, pero no explicando por qué usar chi y por qué se ve de la manera en que lo hace.
Muchas gracias a cualquiera que pueda señalarme en la dirección correcta y eso es, realmente entender por qué estoy usando chi cuando estoy creando un intervalo de confianza para la varianza.
variance
chi-squared
nafrtiti
fuente
fuente
Respuestas:
Respuesta rápida
La razón es porque, asumiendo que los datos son iid y , y definiendo ˉ XXi∼N(μ,σ2)
cuando se forman intervalos de confianza, la distribución de muestreo asociada con la varianza de la muestra (S2, recuerde, ¡una variable aleatoria!) Es una distribución de chi-cuadrado (S2(N-1)/σ2∼χ2n-1), así como la distribución de muestreo asociada con la media muestral es una distribución normal estándar ((ˉX-μ)√
Respuesta larga
En primer lugar, demostraremos que sigue una distribución de chi-cuadrado con N - 1 grados de libertad. Después de eso, veremos cómo esta prueba es útil al derivar los intervalos de confianza para la varianza, y cómo aparece la distribución de chi-cuadrado (¡y por qué es tan útil!). Vamos a empezar.S2(N−1)/σ2 N−1
La prueba
Para esto, quizás deba acostumbrarse a la distribución de chi-cuadrado en este artículo de Wikipedia . Esta distribución tiene solo un parámetro: los grados de libertad, , y tiene una función generadora de momentos (MGF) dada por: m χ 2 ν ( t ) = ( 1 - 2 t ) - ν / 2 . Si podemos demostrar que la distribución de S 2 ( N - 1 ) / σ 2 tiene una función generadora de momento como esta, pero con ν Nν
Si definimos, dondeZi∼N(0,1), es decir, variables aleatorias normales estándar, la función generadora de momento deYviene dada por m Y (t)
IfY1 and Y2 are independent and each distribute as a chi-square distribution but with ν1 and ν2 degrees of freedom, then W=Y1+Y2 distributes with a chi-square distribution with ν1+ν2 degrees of freedom (this follows from taking the MGF of W ; do this!).
With the above facts, note that if you multiply the sample variance byN−1 , you obtain (after some algebra),
Calculating the Confidence Interval for the variance.
When looking for a confidence interval for the variance, you want to know the limitsL1 and L2 in
fuente