Sé por estudios previos que
Sin embargo, no entiendo por qué es eso. Puedo ver que el efecto será 'elevar' la varianza cuando A y B covaran altamente. Tiene sentido que cuando cree un compuesto a partir de dos variables altamente correlacionadas, tenderá a agregar las observaciones altas de A con las observaciones altas de B, y las observaciones bajas de A con las observaciones bajas de B. Esto tenderá a crear valores extremos altos y bajos en la variable compuesta, aumentando la varianza del compuesto.
Pero, ¿por qué funciona multiplicar la covarianza por exactamente 2?
variance
covariance
intuition
user1205901 - Restablecer Monica
fuente
fuente
Respuestas:
Respuesta simple:
La varianza involucra un cuadrado:
Entonces, su pregunta se reduce al factor 2 en la identidad cuadrada:
Que se puede entender visualmente como una descomposición del área de un cuadrado de lado en el área de los cuadrados más pequeños de los lados a y b , además de dos rectángulos de los lados a y b :( a + b ) una si una si
Respuesta más complicada:
Si desea una respuesta matemáticamente más complicada, la covarianza es una forma bilineal, lo que significa que es lineal en sus argumentos primero y segundo, esto lleva a:
En la última línea, utilicé el hecho de que la covarianza es simétrica:
Para resumir:
Es dos porque debe tener en cuenta tanto como c o v ( B , A ) .cov(A,B) cov(B,A)
fuente
El conjunto de variables aleatorias es un espacio vectorial, y muchas de las propiedades del espacio euclidiano pueden ser analógicas a ellas. La desviación estándar actúa como una longitud, y la varianza como la longitud al cuadrado. La independencia corresponde a ser ortogonal, mientras que la correlación perfecta corresponde a la multiplicación escalar. Por lo tanto, la varianza de las variables independientes sigue el Teorema de Pitágoras:var(A+B)=var(A)+var(B)
.
Si están perfectamente correlacionados, entonces
s t d( A + B ) = s t d( A ) + s t d( B )
Tenga en cuenta que esto es equivalente a
v a r ( A + B ) = v a r ( A ) + v a r ( B ) + 2 v a r ( A ) v a r ( B )-----------√
Si no son independientes, siguen una ley análoga a la ley de cosenos:
var(A+B)=var(A)+var(B)+2cov(A,B)
Tenga en cuenta que el caso general es uno entre independencia total y correlación perfecta. Si y B son independientes, entonces c o v ( A , B ) es cero. Entonces, el caso general es que v a r ( A , B ) siempre tiene un término v a r ( A ) y un término v a r ( B ) , y luego tiene alguna variación en el 2 √A B cov(A,B) var(A,B) var(A) var(B) término; cuanto más correlacionadas estén las variables, mayor será este tercer término. Y esto es precisamente lo que2cov(A,B)es: son2 √2 v a r ( A ) v a r ( B )-----------√ 2 c o v ( A , B ) veces elr2deAyB.2 v a r ( A ) v a r ( B )-----------√ r2 UNA si
fuente
fuente