Prueba fácil de

10

Deje ser variables aleatorias normales estándar independientes. Hay muchas pruebas (largas) que muestran queZ1,,Zn

i=1n(Zi1nj=1nZj)2χn12

Muchas pruebas son bastante largas y algunas usan inducción (por ejemplo, inferencia estadística de Casella). Me pregunto si hay alguna prueba fácil de este resultado.

3x89g2
fuente
Para un enfoque geométrico intuitivo (sin coordenadas), consulte la Sección 1.2 del excelente texto El Enfoque sin coordenadas para los modelos lineales de Michael J. Wichura (los detalles técnicos se rellenan en el Teorema 8.2), donde el autor realmente comparó el tradicional prueba de matriz (proporcionada por la respuesta de whuber) y su enfoque de proyección, que muestra que su enfoque geométrico es más natural y menos oscuro. Personalmente, creo que esta prueba es perspicaz y concisa.
Zhanxiong

Respuestas:

10

Para , definak=1,2,,n1

Xk=(Z1+Z2++ZkkZk+1)/k+k2.

Las , que son transformaciones lineales de variables aleatorias distribuidas multinormalmente Z i , también tienen una distribución multinormal. Tenga en cuenta queXkZi

  1. La matriz de varianza-covarianza de es la matriz de identidad n - 1 × n - 1 .(X1,X2,,Xn1)n1×n1

  2. X12+X22++Xn12=i=1n(ZiZ¯)2.

, que es fácil de comprobar, implica directamente ( 2 ) al observar toda la X k no están correlacionadas con ˉ Z . Todos los cálculos se reducen al hecho de que 1 + 1 + + 1 - k = 0 , donde hay k unos.(1)(2)XkZ¯.1+1++1k=0k

Juntos, estos muestran que tiene la distribución de la suma de n - 1 variables de unidad-varianza no correlacionadas. Por definición, esta es la distribución χ 2 ( n - 1 ) , QED .i=1n(ZiZ¯)2n1χ2(n1)

Referencias

  1. Para obtener una explicación de dónde proviene la construcción de , vea el comienzo de mi respuesta en Cómo realizar una transformación isométrica de la relación logarítmica con respecto a las matrices Helmert .Xk

  2. Esta es una simplificación de la demostración general dada en la respuesta de ocram en Por qué se distribuye RSS chi cuadrado por np . Esa respuesta afirma "existe una matriz" para construir la ; Aquí, expongo tal matriz.Xk

whuber
fuente
Esta construcción tiene una interpretación geométrica simple. (1) Las variables se distribuyen en una distribución esférica simétrica n-dimensional (por lo tanto, podemos rotarla de la manera que queramos). (2) ¯ Z se encuentra como una solución al problema lineal Z i = ¯ Z + ϵ i , que es efectivamente una proyección del vector Z en 1 . (3) Si giramos el espacio de coordenadas de modo que una de las coordenadas coincida con este vector de proyección, 1 , entonces el resto es una distribución multinomial (n-1) que representa el espacio residual. ZiZ¯Zi=Z¯+ϵiZ11
Sextus Empiricus
Muestras que las no están correlacionadas entre sí. Pero hasta donde yo entiendo, para decir que una suma de variables normales estándar al cuadrado es χ 2 , necesitamos independencia, ¿cuál es un requisito mucho más fuerte que el no correlacionado? EDITAR: oh espera, si sabemos que dos variables se distribuyen normalmente, entonces no correlacionado implica independencia. Xiχ2
user56834
Además, no entiendo cómo se pasa del hecho de que las no están correlacionadas con ˉ Z (que sí entiendo), a (2). ¿Podrías dar más detalles? XiZ¯
user56834
@Programador Lo siento; No quise decir que es una deducción lógica: (1) y (2) son dos observaciones separadas. (2) es simplemente una identidad algebraica (directa).
whuber
1
Programador, tenga en cuenta el enlace a la otra respuesta que Whuber dio ( stats.stackexchange.com/questions/259208/… ) Las están construidas en base a una matriz, H , con filas ortogonales. Entonces puede evaluar de una manera más abstracta (menos falible) K 2 i como K K = ( H Z ) ( H Z ) = ( H Z ) T ( H Z ) = Z T ( H T H )XkHKi2 , (tenga en cuenta que tenemos que extender K por el vector 1111 para que sea n por n)KK=(HZ)(HZ)=(HZ)T(HZ)=ZT(HTH)Z=ZTIZ=ZZ
Sextus Empiricus
5

Tenga en cuenta que dice que son iid con N normal estándar ( 0 , 1 ) , con μ = 0 y σ = 1ZisN(0,1)μ=0σ=1

Entonces Zi2χ(1)2

Entonces

i=1nZi2=i=1n(ZiZ¯+Z¯)2=i=1n(ZiZ¯)2+nZ¯2(1)=i=1n(ZiZ¯)2+[n(Z¯0)1]2

Tenga en cuenta que el lado izquierdo de (1), y que el segundo término en el lado derecho [

i=1nZi2χ(n)2
[n(Z¯0)1]2χ(1)2.

Además modo que Z i - ˉ Z y ˉ Z son independientes. Por lo tanto, los dos últimos términos en (1) (funciones de Z i - ˉ Z y Z i ) también son independientes. Por lo tanto, sus mgfs están relacionados con el mgf del lado izquierdo de (1) a M n ( t ) = M n - 1 ( t )Cov(ZiZ¯,Z¯)=0ZiZ¯Z¯ZiZ¯Zi , donde M n ( t ) = ( 1 - 2 t ) - n / 2 y M 1 ( t ) = ( 1 - 2 t ) - 1 / 2 . El mgf den i = 1 ( Z i - ˉ Z ) 2 es, por lo tanto, M n - 1

Mn(t)=Mn1(t)M1(t)
Mn(t)=(12t)n/2M1(t)=(12t)1/2i=1n(ZiZ¯)2 . Por lo tanto,n i = 1 ( Z i - ˉ Z ) 2 es chi-cuadrado con n - 1 grados de libertad.Mn1(t)=Mn(t)/M1(t)=(12t)(n1)/2i=1n(ZiZ¯)2n1
Norte profundo
fuente
1
El último "Por lo tanto" es demasiado descuidado
Zhanxiong
X¯
2
X¯Zi2Z¯(ZiZ¯)2Z¯
Creo que usé el Teorema de Cochran
Deep North el
3
@DeepNorth Si completó algunas piezas faltantes en su prueba
Jarle Tufto