Fondo
Supongamos que tenemos un modelo de mínimos cuadrados ordinarios donde tenemos coeficientes en nuestro modelo de regresión,
donde es un vector de coeficientes , es la matriz de diseño definida por
Minimizamos la suma de los errores al cuadrado al establecer nuestras estimaciones para en
Un estimador imparcial de es donde \ mathbf {\ hat {y}} \ equiv \ mathbf {X} \ mathbf {\ hat {\ beta}} ( ref ).
La covarianza de viene dada por
Pregunta
¿Cómo puedo probar que para ,
Mis intentos
Sé que para variables aleatorias muestreadas de , puede mostrar que reescribiendo el LHS como y darse cuenta de que el numertor es una distribución normal estándar, y el denominador es la raíz cuadrada de una distribución Chi-cuadrado con df = (n-1) y dividido por (n- 1) ( ref .) Y, por lo tanto, sigue una distribución t con df = (n-1) ( ref ).
No pude extender esta prueba a mi pregunta ...
¿Algunas ideas? Soy consciente de esta pregunta , pero no lo prueban explícitamente, solo dan una regla general, diciendo que "cada predictor le cuesta un grado de libertad".
Respuestas:
Desde sabemos que y así sabemos que para cada componente de , donde es el elemento diagonal de . Por lo tanto, sabemos que
Tome nota de la declaración del Teorema para la distribución de una forma cuadrática idempotente en un vector normal estándar (Teorema B.8 en Greene):
Deje que denote el vector residual de regresión y deje que que es la matriz del fabricante residual (es decir, ) . Es fácil verificar que es simétrica e idempotente .ε^
Sea un estimador de .
Entonces necesitamos hacer algo de álgebra lineal. Tenga en cuenta estas tres propiedades de álgebra lineal:
Entonces
Entonces
Aplicando el teorema para la distribución de una forma cuadrática idempotente en un vector normal estándar (mencionado anteriormente), sabemos que .V∼χ2n−p
Como supuso que se distribuye normalmente, entonces es independiente de , y dado que es una función de , entonces también es independiente de . Por lo tanto, y son independientes entre sí.ε β^ ε^ s2 ε^ s2 β^ zk V
Entonces, es la relación de una distribución Normal estándar con la raíz cuadrada de una distribución Chi-cuadrado con los mismos grados de libertad (es decir, ), que es una caracterización de la distribución . Por lo tanto, la estadística tiene una distribución con grados de libertad.
Entonces puede ser manipulado algebraicamente en una forma más familiar.
fuente
Theorem for the Distribution of an Idempotent Quadratic Form in a Standard Normal Vector
, ¿no necesitamos también que sea simétrica? Desafortunadamente, no tengo Greene, así que no puedo ver la prueba, aunque vi que Wikipedia tenía la misma forma que tú . Sin embargo, un contraejemplo parece ser la matriz idempotente que conduce a que no es Chi-Squared ya que podría tomar valores negativos. ..