Intuición detrás de la fórmula para la varianza de una suma de dos variables.

10

Sé por estudios previos que

Var(A+B)=Var(A)+Var(B)+2Cov(A,B)

Sin embargo, no entiendo por qué es eso. Puedo ver que el efecto será 'elevar' la varianza cuando A y B covaran altamente. Tiene sentido que cuando cree un compuesto a partir de dos variables altamente correlacionadas, tenderá a agregar las observaciones altas de A con las observaciones altas de B, y las observaciones bajas de A con las observaciones bajas de B. Esto tenderá a crear valores extremos altos y bajos en la variable compuesta, aumentando la varianza del compuesto.

Pero, ¿por qué funciona multiplicar la covarianza por exactamente 2?

user1205901 - Restablecer Monica
fuente
1
Si y están perfectamente correlacionados positivamente, entonces y si están perfectamente correlacionados negativamente, entonces . La covarianza mide hasta qué punto a lo largo de este rango está su relaciónB V a r ( A + B ) = V a r ( A ) + V a r ( B ) + 2 UNAsiVar(A+B)=Var(A)+Var(B)+2Var(A)Var(B)Vunar(UNA+si)=Vunar(UNA)+Vunar(si)-2Vunar(UNA)Vunar(si)
Henry

Respuestas:

21

Respuesta simple:

La varianza involucra un cuadrado:

Vunar(X)=mi[(X-mi[X])2]

Entonces, su pregunta se reduce al factor 2 en la identidad cuadrada:

(una+si)2=una2+si2+2unasi

Que se puede entender visualmente como una descomposición del área de un cuadrado de lado en el área de los cuadrados más pequeños de los lados a y b , además de dos rectángulos de los lados a y b :(una+si)unasiunasi

ingrese la descripción de la imagen aquí

Respuesta más complicada:

Si desea una respuesta matemáticamente más complicada, la covarianza es una forma bilineal, lo que significa que es lineal en sus argumentos primero y segundo, esto lleva a:

Var(A+B)=Cov(A+B,A+B)=Cov(A,A+B)+Cov(B,A+B)=Cov(UNA,UNA)+Cov(UNA,si)+Cov(si,UNA)+Cov(si,si)=Vunar(UNA)+2Cov(UNA,si)+Vunar(si)

En la última línea, utilicé el hecho de que la covarianza es simétrica:

Cov(A,B)=Cov(B,A)

Para resumir:

Es dos porque debe tener en cuenta tanto como c o v ( B , A ) .cov(A,B)cov(B,A)

byouness
fuente
5

El conjunto de variables aleatorias es un espacio vectorial, y muchas de las propiedades del espacio euclidiano pueden ser analógicas a ellas. La desviación estándar actúa como una longitud, y la varianza como la longitud al cuadrado. La independencia corresponde a ser ortogonal, mientras que la correlación perfecta corresponde a la multiplicación escalar. Por lo tanto, la varianza de las variables independientes sigue el Teorema de Pitágoras:
.var(A+B)=var(A)+var(B)

Si están perfectamente correlacionados, entonces
std(A+B)=std(A)+std(B)

Tenga en cuenta que esto es equivalente a
var(A+B)=var(A)+var(B)+2var(A)var(B)

Si no son independientes, siguen una ley análoga a la ley de cosenos:
var(A+B)=var(A)+var(B)+2cov(A,B)

Tenga en cuenta que el caso general es uno entre independencia total y correlación perfecta. Si y B son independientes, entonces c o v ( A , B ) es cero. Entonces, el caso general es que v a r ( A , B ) siempre tiene un término v a r ( A ) y un término v a r ( B ) , y luego tiene alguna variación en el 2 ABcov(A,B)var(A,B)var(A)var(B) término; cuanto más correlacionadas estén las variables, mayor será este tercer término. Y esto es precisamente lo que2cov(A,B)es: son22vunar(UNA)vunar(si)2Cov(UNA,si) veces elr2deAyB.2vunar(UNA)vunar(si)r2UNAsi

var(A+B)=var(A)+var(B)+MeasureOfCorrelationPerfectCorrelationTerm

MeasureOfCorrelation=r2PerfectCorrelationTerm=2var(A)var(B)

r=correl(A,B)

σUNA+si=σUNA2+σsi2+2(rσUNA)(rσsi)

r2Cos

Acumulacion
fuente
2

Vunar(UNA+si)VunarCov

A+B

  1. A
  2. B
  3. AB
  4. BA

Var(A+B)=Var(A)+Var(B)+Cov(A,B)+Cov(B,A)
=Var(A)+Var(B)+2Cov(A,B)
Cov
Bananin
fuente