Ecuación para los factores de inflación de varianza

8

Después de una pregunta formulada anteriormente, los factores de inflación de varianza (VIF) se pueden expresar como es la versión escalada de longitud de unidad de

VIFj=Var(b^j)σ2=[wjwjwjWj(WjWj)1Wjwj]1
WX

¿Alguien puede mostrarme cómo llegar desde aquí a la ecuación es el coeficiente de determinación múltiple obtenido de la regresión de en las otras variables del regresor.

VIFj=11Rj2
Rj2xj

Tengo muchos problemas para hacer bien estas operaciones matriciales ...

Comunidad
fuente

Respuestas:

9

Suponga que todas las variables están estandarizadas por la transformación de correlación, como usted mencionó, la versión escalada de longitud de unidad de . El modelo estandarizado no cambia la correlación entre las variables se puede calcular cuando se realiza la transformación estandarizada del modelo lineal original. Denotemos la matriz de diseño después de la transformación estandarizada como Entonces XXXVIF

X=[1X11X1,p11X21X2,p11Xn1Xn,p1].
XX=[n00rXX],
donde es la matriz de correlación de variables. También sabemos que para es el término diagonal -ésimo de .rXXX
σ2{β^}=σ2(XX)1=σ2[1n00rXX1.]
VIFkk=1,2,,p1krXX1k=1rXXk . Definamos: Tenga en cuenta que ambas matrices son diferentes de las matrices de diseño. Como solo nos preocupamos por los coeficientes de las variables , el vector de una matriz de diseño puede ignorarse en nuestro cálculo. Por lo tanto, al usar el complemento de Schur ,
X(1)=[X12X1,p1X22X2,p1Xn2Xn,p1],X1=[X11X21Xn1].
X1
rXX1(1,1)=(r11r1X(1)rX(1)X(1)1rX(1)1)1=(r11[r1X(1)rX(1)X(1)1]rX(1)X(1)[rX(1)X(1)1rX(1)1])1=(1β1X(1)X(1)X(1)β1X(1))1,
donde son los coeficientes de regresión de en excepto la intersección. De hecho, la intercepción debe ser el origen, ya que todas lasβ1X(1)X1X2,,Xp1XLas variables están estandarizadas con media cero. Por otro lado, (sería más sencillo si pudiéramos escribir todo en forma de matriz explícita) Por lo tanto
R12=SSRSSTO=β1X(1)X(1)X(1)β1X(1)1=β1X(1)X(1)X(1)β1X(1).
VIF1=rXX1(1,1)=11R12.

jwyao
fuente