En un artículo que escribí, modelé las variables aleatorias y lugar de e para eliminar eficazmente los problemas que surgen cuando e están altamente correlacionados y tienen la misma varianza (como en mi aplicación). Los árbitros quieren que les dé una referencia. Podría demostrarlo fácilmente, pero al ser un diario de aplicaciones prefieren una referencia a una simple derivación matemática.X - Y X Y X Y
¿Alguien tiene alguna sugerencia para una referencia adecuada? Pensé que había algo en el libro EDA de Tukey (1977) sobre sumas y diferencias, pero no puedo encontrarlo.
correlation
multicollinearity
Rob Hyndman
fuente
fuente
Respuestas:
Me referiría al análisis de regresión lineal de Seber GAF (1977). Wiley, Nueva York. Teorema 1.4.
Esto dice .cov(AX,BY)=Acov(X,Y)B′
Tome = (1 1) y = (1 -1) y = = vector con sus X e Y.A B X Y
Tenga en cuenta que, para tener , es fundamental que X e Y tengan variaciones similares. Si , será grande.var ( X ) ≫ var ( Y ) cov ( X + Y , X - Y )cov(X+Y,X−Y)≈0 var(X)≫var(Y) cov(X+Y,X−Y)
fuente