Sé que la distribución de la varianza muestral
Es por el hecho de que puede expresarse en forma de matriz,
xAx ' (donde A: simétrica), y podría expresarse nuevamente en: x'QDQ'x (donde Q: ortonormal, D: matriz diagonal).
¿Qué pasa con , dada la suposición ?
Calculo
Pero no tengo idea de cómo demostrarlo o mostrarlo.
¿Se distribuye exactamente como ?
Respuestas:
Podemos probar esto para un caso más general de variables utilizando la "matriz de sombreros" y algunas de sus propiedades útiles. Estos resultados suelen ser mucho más difíciles de establecer en términos no matriciales debido al uso de la descomposición espectral.p
Ahora en la versión matricial de mínimos cuadrados, la matriz del sombrero es donde tiene filas y columnas (columna de unos para ). Asuma el rango completo de la columna por conveniencia; de lo contrario, podría reemplazar por el rango de la columna de a continuación. Podemos escribir los valores ajustados como o en notación matricial . Usando esto, podemos escribir la suma de cuadrados como:H=X(XTX)−1XT X n p+1 β0 p+1 X Y^i=∑nj=1HijYj Y^=HY
Donde es una matriz de identidad de orden . El último paso se deduce del hecho de que es una matriz idepotente, comoIn n H
Ahora, una propiedad clara de las matrices idepotentes es que todos sus valores propios deben ser iguales a cero o uno. Dejando que denote un vector propio normalizado de con valor propio , podemos probar esto de la siguiente manera:e H l
(tenga en cuenta que no puede ser cero ya que debe satisfacer ) Ahora porque es idepotente, también lo es, porquee eTe=1 H In−H
También tenemos la propiedad de que la suma de los valores propios es igual a la traza de la matriz, y
Por lo tanto, debe tener valores propios iguales a y valores propios iguales a .I−H n−p−1 1 p+1 0
Ahora podemos usar la descomposición espectral de donde y es ortogonal (porque es simétrica). Una propiedad adicional que es útil es que . Esto ayuda a reducir la matrizI−H=ADAT D=(In−p−10[p+1]×[n−p−1]0[n−p−1]×[p+1]0[p+1]×[p+1]) A I−H HX=X A
y obtenemos:
Ahora, bajo el modelo tenemos y usando la teoría normal estándar tenemos que muestra que los componentes de son independientes. Ahora, usando el resultado útil, tenemos que para . La distribución de chi-cuadrado con grados de libertad para la suma de los errores al cuadrado sigue inmediatamente.Y∼N(Xβ,σ2I) ATY∼N(ATXβ,σ2ATA)∼N(ATXβ,σ2I) ATY (ATY)i∼N(0,σ2) i=1,…,n−p−1 n−p−1
fuente