Varianza del producto de k variables aleatorias correlacionadas

Respuestas:

12

Puede encontrar más información sobre este tema de la que probablemente necesite en Goodman (1962): "La varianza del producto de las variables aleatorias K" , que deriva fórmulas para variables aleatorias independientes y variables aleatorias potencialmente correlacionadas, junto con algunas aproximaciones. En un artículo anterior ( Goodman, 1960 ), se derivó la fórmula para el producto de exactamente dos variables aleatorias, que es algo más simple (aunque todavía bastante retorcido), por lo que podría ser un mejor lugar para comenzar si desea comprender la derivación .

Para completar, sin embargo, va así.

Dos variables

Suponga lo siguiente:

  • y y son dos variables aleatoriasxy
  • e Y son sus expectativas (distintas de cero)XY
  • y V ( y ) son sus variacionesV(x)V(y)
  • (y del mismo modo para δ y )δx=(xX)/Xδy
  • Di,j=E[(δx)i(δy)j]
  • (e igualmente para Δ y )Δx=xXΔy
  • Ei,j=E[(Δx)i(Δy)j]
  • es el coeficiente de variación al cuadrado: V ( x ) / X 2 (igualmente para G ( Y ) )G(x)V(x)/X2G(Y)

Entonces: o equivalente:

V(xy)=(XY)2[G(y)+G(x)+2D1,1+2D1,2+2D2,1+D2,2D1,12]

V(xy)=X2V(y)+Y2V(x)+2XYE1,1+2XE1,2+2YE2,1+E2,2E1,12

Más de dos variables

El artículo de 1960 sugiere que este es un ejercicio para el lector (¡que parece haber motivado el artículo de 1962!).

La notación es similar, con algunas extensiones:

  • sean las variables aleatorias en lugar de x e y(x1,x2,xn)xy
  • M=E(i=1kxi)
  • A=(M/i=1kXi)1
  • = 0, 1 o 2 para i = 1 , 2 , ksii=1,2,k
  • = número de 1 en ( s 1 , s 2 , ... s k )u(s1,s2,sk)
  • = número de 2 en ( s 1 , s 2 , ... s k )m(s1,s2,sk)
  • para m = 0 y 2 u para m > 1 ,D(u,m)=2u2m=02um>1
  • C(s1,s2,,sk)=D(u,m)E(i=1kδxisi)
  • indica la suma de la 3 k - k - 1 grupos de ( s 1 , s 2 , ... s k ) donde 2 m + u > 1s1sk3kk1(s1,s2,sk)2m+u>1

Entonces, por fin:

V(i=1kxi)=Xi2(s1skC(s1,s2sk)A2)

¡Vea los documentos para más detalles y aproximaciones ligeramente más manejables!

Matt Krause
fuente
tenga en cuenta que la respuesta anterior de Matt Krause contiene un error, así como el documento en sí. En la definición de la función C (s1, ..., sk) debería ser un producto en lugar de una suma.
Nicolas Gisler
¿Podrías elaborar un poco más ...? "Debido a que - una persona anónima a través de Internet - lo diga" no es realmente una respuesta ...
Tim
Si intenta obtener la varianza var (x * y) para variables aleatorias independientes, a través de la fórmula para k arbitraria puede ver que solo un producto y no una suma le da la respuesta correcta. Además, si observa el documento, también puede verlo, en la página 59 del documento (al menos en mi versión) utilizó un producto en lugar de una suma.
Nicolas Gisler
1
Para el caso de dos variables aleatorias, @macro puede encontrar una fórmula más fácil de leer para la varianza del producto de dos variables aleatorias correlacionadas en esta respuesta . Esta respuesta también señala el problema esencial en saber,el matorral de notación oculta el hecho esencial de que hay términos en él cuyo valor no puede determinarse a menos que sepamos cov ( x 2 , y 2 ) , o lo suficiente sobre la articulación densidad de las dos variables aleatorias para determinar esta cantidad.
V(xy)=X2V(y)+Y2V(x)+2XYE1,1+2XE1,2+2YE2,1+E2,2E1,12,
(x2,y2)
Dilip Sarwate
Una sugerencia de edición, que realmente debería haber sido un comentario, sugirió que el documento original contenía un error tipográfico en el que se mezclaban una suma y un producto y esta respuesta debería modificarse. Ver stats.stackexchange.com/review/suggested-edits/83662
Silverfish el
4

Solo para agregar a la increíble respuesta de Matt Krause (de hecho, fácilmente derivable de allí). Si x, y son independientes, entonces,

E1,1=E[(xE[x])(yE[y])]=Cov(x,y)=0E1,2=E[(xE[x])(yE[y])2]=E[xE(x)]E[(yE[y])2]=(E[x]E[x])E[(yE[y])2]=0E2,1=0E2,2=E[(xE[x])2(yE[y])2]=E[(xE[x])2]E[(yE[y])2=V[x]V[y]V[xy]=E[x]2V[y]+E[y]2V[x]+V[x]V[y]
Ananda
fuente
1
n
3

Además de la fórmula general dada por Matt, vale la pena señalar que hay una fórmula algo más explícita para las variables aleatorias gaussianas de media cero. Se sigue del teorema de Isserlis , ver también Momentos más altos para la distribución normal multivariada centrada.

(x1,,xk)ΣkE(ixi)=0

V(ixi)=E(ixi2)=Σ~i,j
Σ{1,,2k}k{i,j}k Σ~i,j
Σ~=(ΣΣΣΣ)
(x1,,xk,x1,,xk)k
V(ixi)=Σ~i,j(Σi,j)2.
k=2
V(x1x2)=Σ1,1Σ2,2+2(Σ1,2)2Σ1,22=Σ1,1Σ2,2+(Σ1,2)2.
k=3
V(x1x2x3)=Σi,jΣk,lΣr,t,

setpartspartitionsk=8k=9k=10

k=2k

NRH
fuente
O(3k)