Varianza del producto de variables dependientes

32

¿Cuál es la fórmula para la varianza del producto de variables dependientes?

En el caso de variables independientes, la fórmula es simple:

var(XY)=E(X2Y2)E(XY)2=var(X)var(Y)+var(X)E(Y)2+var(Y)E(X)2
Pero, ¿cuál es la fórmula para las variables correlacionadas?

Por cierto, ¿cómo puedo encontrar la correlación basada en los datos estadísticos?

Riga
fuente

Respuestas:

32

Bueno, usando la identidad familiar que señaló,

var(XY)=E(X2Y2)E(XY)2

Usando la fórmula análoga para la covarianza,

E(X2Y2)=cov(X2,Y2)+E(X2)E(Y2)

y

E(XY)2=[cov(X,Y)+E(X)E(Y)]2

lo que implica que, en general, var(XY) puede escribirse como

cov(X2,Y2)+[var(X)+E(X)2][var(Y)+E(Y)2][cov(X,Y)+E(X)E(Y)]2

Tenga en cuenta que en el caso de independencia, y esto se reduce acov(X2,Y2)=cov(X,Y)=0

[var(X)+E(X)2][var(Y)+E(Y)2][E(X)E(Y)]2

y los dos términos cancelan y obtienes[E(X)E(Y)]2

var(X)var(Y)+var(X)E(Y)2+var(Y)E(X)2

como señaló anteriormente.

Editar: si todo lo que observa es y no X e Y por separado, entonces no creo que haya una manera de estimar c o v ( X , Y ) o c o v ( X 2 , Y 2 ) excepto en casos especiales (por ejemplo, si X , Y tienen medios conocidos a priori )XYXYcov(X,Y)cov(X2,Y2)X,Y

Macro
fuente
2
¿por qué pones [var (X) + E (X) 2] ⋅ [var (Y) + E (Y) 2] en lugar de E (X2) E (Y2) ???
1
@ user35458, para que pueda terminar con la ecuación como una expresión de var (X) y var (Y), por lo tanto comparable a la declaración de OP. Tenga en cuenta que E (X ^ 2) = Var (X) + E (X) ^ 2.
Waldir Leoncio
2
Para responder (fuera de línea) a un desafío ahora eliminado a la validez de esta respuesta, comparé sus resultados con el cálculo directo de la varianza del producto en muchas simulaciones. No es una fórmula práctica para usar si puede evitarlo, porque puede perder una precisión sustancial a través de la cancelación al restar un término grande de otro, pero ese no es el punto. Un error a tener en cuenta es que esta pregunta se refiere a variables aleatorias. Sus resultados se aplican a los datos siempre que calcule variaciones y covarianzas utilizando denominadores de lugar de n - 1nn1 (como es habitual en el software).
whuber
14

Esta es una adición a la muy buena respuesta de @ Macro que establece exactamente lo que se necesita saber para determinar la varianza del producto de dos variables aleatorias correlacionadas. Desde dondecov(X,Y),E[X],E[Y],E

(1)var(XY)=E[(XY)2](E[XY])2=E[(XY)2](cov(X,Y)+E[X]E[Y])2(2)=E[X2Y2](cov(X,Y)+E[X]E[Y])2(3)=(cov(X2,Y2)+E[X2]E[Y2])(cov(X,Y)+E[X]E[Y])2
cov(X,Y)E[X]E[Y] , y E [ Y 2 ] se puede suponer que son cantidades conocidas, necesitamos poder determinar el valor de E [ X 2 Y 2 ] en ( 2 ) o cov ( X 2 , Y 2 ) en ( 3 ) . Esto no es fácil de hacer en general, pero, como ya se señaló, si X e Y sonvariables aleatoriasindependientes, entonces cov ( X ,E[X2]E[Y2]E[X2Y2](2)cov(X2,Y2)(3)XY . De hecho, ladependencia,no la correlación (o falta de ella) es la cuestión clave. Que sepamos que cov ( X , Y ) es igual a 0 en lugar de algún valor distinto de cero,por sí solo, noayuda en lo más mínimo en nuestros esfuerzos a determinar el valor de E [ X 2 Y 2 ] o cov ( X 2 , Y 2 ) a pesar de que cov(X,Y)=cov(X2,Y2)=0cov(X,Y)0E[X2Y2]cov(X2,Y2)(2)(3)

XYE[X2Y2]

XYρX=xYE[Y]+ρvar(Y)var(X)(xE[X]) and variance var(Y)(1ρ2). Thus,

E[X2Y2X]=X2E[Y2X]=X2[var(Y)(1ρ2)+(E[Y]+ρvar(Y)var(X)(XE[X]))2]
which is a quartic function of X, say g(X), and the Law of Iterated Expectation tells us that
(4)E[X2Y2]=E[E[X2Y2X]]=E[g(X)]
where the right side of (4) can be computed from knowledge of the 3rd and 4th moments of X -- standard results that can be found in many texts and reference books (meaning that I am too lazy to look them up and include them in this answer).

Further addendum: In a now-deleted answer, @Hydrologist gives the variance of XY as

(5)Var[xy]=(E[x])2Var[y]+(E[y])2Var[x]+2E[x]Cov[x,y2]+2E[y]Cov[x2,y]+2E[x]E[y]Cov[x,y]+Cov[x2,y2](Cov[x,y])2
and claims that this formula is from two papers published a half-century ago in JASA. This formula is an incorrect transcription of the results in the paper(s) cited by Hydrologist. Specifically, Cov[x2,y2] is a mistranscription of E[(xE[x])2(yE[y])2] in the journal article, and similarly for Cov[x2,y] and Cov[x,y2].
Dilip Sarwate
fuente
For the computation of E(X2Y2) in the joint normal case, also see math.stackexchange.com/questions/668641/…
Samuel Reid