La referencia para la suma y diferencia de variables altamente correlacionadas es casi no correlacionada

11

En un artículo que escribí, modelé las variables aleatorias y lugar de e para eliminar eficazmente los problemas que surgen cuando e están altamente correlacionados y tienen la misma varianza (como en mi aplicación). Los árbitros quieren que les dé una referencia. Podría demostrarlo fácilmente, pero al ser un diario de aplicaciones prefieren una referencia a una simple derivación matemática.X - Y X Y X YX+YXYXYXY

¿Alguien tiene alguna sugerencia para una referencia adecuada? Pensé que había algo en el libro EDA de Tukey (1977) sobre sumas y diferencias, pero no puedo encontrarlo.

Rob Hyndman
fuente
Wikipedia tiene una referencia a un libro de texto en en.wikipedia.org/wiki/… ; no estoy seguro que ayuda ...
shabbychef
44
Y la prueba de hecho es más que trivial con variaciones iguales :( ... Buena suerte, Rob.Cov(X+Y,XY)=E((XμX)+(YμY))((XμX)(YμY))=VarXVarY=0
Dmitrij Celov
2
Tukey no prueba nada en EDA: procede con el ejemplo. Para ver un ejemplo de mirar versus vea el Anexo 3 del capítulo 14, p. 473 (la discusión comienza en la p. 470). y+xyx
whuber
1
Una forma alternativa de evitar tener que proporcionar una referencia. Puede considerarlo como un modelo de los componentes principales de sus datos , en lugar de las variables individuales en sí. Eso sería una cosa fácil de proporcionar una referencia paraX,Y
probabilityislogic

Respuestas:

3

Me referiría al análisis de regresión lineal de Seber GAF (1977). Wiley, Nueva York. Teorema 1.4.

Esto dice .cov(AX,BY)=Acov(X,Y)B

Tome = (1 1) y = (1 -1) y = = vector con sus X e Y.ABXY

Tenga en cuenta que, para tener , es fundamental que X e Y tengan variaciones similares. Si , será grande.var ( X ) var ( Y ) cov ( X + Y , X - Y )cov(X+Y,XY)0var(X)var(Y)cov(X+Y,XY)

Karl
fuente
1
WZcov(W,Z)00ρW,Z00