¿Por qué se usa chi cuadrado al crear un intervalo de confianza para la varianza?

15

Esta es una pregunta muy básica. ¿Por qué usamos una distribución de chi cuadrado? ¿Cuál es el significado de esta distribución? ¿Por qué es esta la distribución utilizada para crear un intervalo de confianza para la varianza?

Cada lugar en el que busco una explicación en Google solo presenta esto como un hecho, explicando cuándo usar chi, pero no explicando por qué usar chi y por qué se ve de la manera en que lo hace.

Muchas gracias a cualquiera que pueda señalarme en la dirección correcta y eso es, realmente entender por qué estoy usando chi cuando estoy creando un intervalo de confianza para la varianza.

nafrtiti
fuente
44
Lo usa porque - cuando los datos son normales - Q=(n1)s2σ2χn12 . (Esto hace queseaQuna cantidad fundamental)
Glen_b -Reinstate Monica el
2
Consulte también stats.stackexchange.com/questions/15711/… y sus enlaces.
Nick Cox
1
Para aquellos que estén interesados ​​en las aplicaciones o investigaciones adicionales en , querrán prestar atención a la distinción entre una distribución χ 2 ("chi-cuadrado") y una distribución χ ("chi") (es la raíz cuadrada de a χ 2 , como era de esperar). χ2χ2χχ2
whuber

Respuestas:

23

Respuesta rápida

La razón es porque, asumiendo que los datos son iid y , y definiendo ˉ XXiN(μ,σ2) cuando se forman intervalos de confianza, la distribución de muestreo asociada con la varianza de la muestra (S2, recuerde, ¡una variable aleatoria!) Es una distribución de chi-cuadrado (S2(N-1)/σ2χ2n-1), así como la distribución de muestreo asociada con la media muestral es una distribución normal estándar ((ˉX-μ)

X¯=NXiNS2=N(X¯Xi)2N1
S2S2(N1)/σ2χn12) cuando conoce la varianza, y con un t-student cuando no (( ˉ X -μ)(X¯μ)n/σZ(0,1) ).(X¯μ)n/STn1

Respuesta larga

En primer lugar, demostraremos que sigue una distribución de chi-cuadrado con N - 1 grados de libertad. Después de eso, veremos cómo esta prueba es útil al derivar los intervalos de confianza para la varianza, y cómo aparece la distribución de chi-cuadrado (¡y por qué es tan útil!). Vamos a empezar.S2(N1)/σ2N1

La prueba

Para esto, quizás deba acostumbrarse a la distribución de chi-cuadrado en este artículo de Wikipedia . Esta distribución tiene solo un parámetro: los grados de libertad, , y tiene una función generadora de momentos (MGF) dada por: m χ 2 ν ( t ) = ( 1 - 2 t ) - ν / 2 . Si podemos demostrar que la distribución de S 2 ( N - 1 ) / σ 2 tiene una función generadora de momento como esta, pero con ν Nν

mχν2(t)=(12t)ν/2.
S2(N1)/σ2 , entonces hemos demostrado que S 2 ( N - 1 ) /ν=N1 sigue una distribución de chi-cuadrado con N - 1 grados de libertad. Para mostrar esto, tenga en cuenta dos hechos:S2(N1)/σ2N1
  1. Si definimos, dondeZiN(0,1), es decir, variables aleatorias normales estándar, la función generadora de momento deYviene dada por m Y (t)

    Y=(XiX¯)2σ2=Zi2,
    ZiN(0,1)Y
    mY(t)=E[etY]=E[etZ12]×E[etZ22]×...E[etZN2]=mZi2(t)×mZ22(t)×...mZN2(t).
    Z2 is given by
    mZ2(t)=f(z)exp(tz2)dz=(12t)1/2,
    where I have used the PDF of the standard normal, f(z)=ez2/2/2π and, hence,
    mY(t)=(12t)N/2,
    which implies that Y follows a chi-square distribution with N degrees of freedom.
  2. If Y1 and Y2 are independent and each distribute as a chi-square distribution but with ν1 and ν2 degrees of freedom, then W=Y1+Y2 distributes with a chi-square distribution with ν1+ν2 degrees of freedom (this follows from taking the MGF of W; do this!).

With the above facts, note that if you multiply the sample variance by N1, you obtain (after some algebra),

(N1)S2=n(X¯μ)+(Xiμ)2,
and, hence, dividing by σ2,
(N1)S2σ2+(X¯μ)2σ2/N=(Xiμ)2σ2.
Note that the second term in the left-side of this sum distributes as a chi-square distribution with 1 degree of freedom, and the right-hand side sum distributes as a chi-square with N degrees of freedom. Therefore, S2(N1)/σ2 distributes as a chi-square with N1 degrees of freedom.

Calculating the Confidence Interval for the variance.

When looking for a confidence interval for the variance, you want to know the limits L1 and L2 in

P(L1σ2L2)=1α.
Let's play with the inequality inside the parenthesis. First, divide by S2(N1),
L1S2(N1)σ2S2(N1)L2S2(N1).
And then remember two things: (1) the statistic S2(N1)/σ2 has a chi-squared distribution with N1 degrees of freedom and (2) the variances is always greather than zero, which implies that you can invert the inequalities, because
L1S2(N1)σ2S2(N1)S2(N1)σ2S2(N1)L1,σ2S2(N1)L2S2(N1)S2(N1)L2S2(N1)σ2,
hence, the probability we are looking for is:
P(S2(N1)L2S2(N1)σ2S2(N1)L1)=1α.
Note that S2(N1)/σ2χ2(N1). We want then,
S2(N1)L2N1pχ2(x)dx=(1α)/2   ,N1S2(N1)L1pχ2(x)dx=(1α)/2  
(we integrate up to N1 because the expected value of a chi-squared random variable with N1 degrees of freedom is N1) or, equivalently,
0S2(N1)L2pχ2(x)dx=α/2,S2(N1)L1pχ2(x)dx=α/2.
Calling χα/22=S2(N1)L2 and χ1α/22=S2(N1)L1, where the values χα/22 and χ1α/22 can be found in chi-square tables (in computers mainly!) and solving for L1 and L2,
L1=S2(N1)χ1α/22,L2=S2(N1)χα/22.
Hence, your confidence interval for the variance is
C.I.=(S2(N1)χ1α/22,S2(N1)χα/22).
Néstor
fuente
1
Simply because S2 does not follow a centered chi-square distribution, while S2(N1)/σ2 does and, therefore, its easier to work with. Are you asking for a derivation for that? (i.e., you want someone to show you that S2(N1)/σ2 follows a chi-square distribution with N1 degrees of freedom?)
Néstor
4
It would be helpful to modify this answer to include the very strong but unstated assumption that the sample variance follows a chi-squared distribution when the underlying data are independent and follow a normal distribution. Unlike the theory of the distribution of the sample mean, where in practice its sampling distribution will be approximately Normal to reasonable accuracy in many situations, this same asymptotic behavior tends not to happen with the sample variance (until sample sizes become extremely large).
whuber
1
Oops. So, so true! This actually came from a problem solution that I handed out to some students, where I state on the question all these assumptions. I edited the answer now.
Néstor
1
@user34756 The reason we don't use the distribution of S2 directly is that its distribution depends on the value of a parameter. You may find it useful to investigate the use of pivotal quantities in constructing confidence intervals.
Glen_b -Reinstate Monica
1
Isn't f(z)=ez2/2 instead of f(z)=ez2 ?
Benoît Legat