¿Cuál es la distribución de la suma de las variantes gaussianas no iid?

36

Si X se distribuye N(μX,σX2) , Y se distribuye y , sé que se distribuye si X e Y son independientes.N(μY,σY2)Z=X+YZN(μX+μY,σX2+σY2)

Pero, ¿qué pasaría si X e Y no fueran independientes, es decir (X,Y)N((μXμY),(σX2σX,YσX,YσY2))

¿Afectaría esto a cómo se distribuye la suma ?Z

JCWong
fuente
77
Solo me gustaría señalar que hay todo tipo de distribuciones conjuntas para (X,Y) no sean bivariadas normales que todavía tienen e marginalmente normales. Y esta distinción marcaría una gran diferencia en las respuestas. XY
2
@ G.JayKerns Estoy de acuerdo en que si X e Y son normales pero no necesariamente conjuntamente normales, entonces X+Y puede tener una distribución diferente a la normal. Pero la afirmación del OP de que " Z se distribuye N(μx+μy,σx2+σy2) si X e Y son independientes". Es absolutamente correcto. Si X e Yson marginalmente normales (como dice la primera parte de la oración) e independientes (como se supone en la segunda parte de la oración), entonces también son conjuntamente normales. En la pregunta del OP , la normalidad conjunta se asume explícitamente y, por lo tanto, cualquier combinación lineal de X e Y es normal.
Dilip Sarwate
3
@Dilip, déjame aclarar que no hay nada de malo en la pregunta y que no hay nada de malo en tu respuesta (+1) (o la probabilidad, tampoco (+1)). Simplemente estaba señalando que si e Y son dependientes, entonces no es necesario que sean conjuntamente normales, y no estaba claro que el OP hubiera considerado esa posibilidad. Además, me temo (aunque no he pasado mucho tiempo pensando) que sin algunas otras suposiciones (como la normalidad conjunta), la pregunta podría incluso no tener respuesta. XY
55
Como @ G.JayKerns menciona, por supuesto, podemos obtener todo tipo de comportamientos interesantes si consideramos las distribuciones normales de manera marginal, pero no conjunta. Aquí es un ejemplo simple: Let sea normal estándar y ε = ± 1 con probabilidad 1/2 cada uno, independientemente de X . Deje que Y = ε X . Entonces Y también es normal normal, pero Z = X + Y es exactamente igual a cero con probabilidad 1/2 y es igual a 2 X con probabilidad 1/2. Xε=±1XY=εXYZ=X+Y2X
Cardenal
44
Podemos obtener una gran variedad de comportamientos diferentes al considerar la cópula bivariada que está asociada con través del teorema de Sklar . Si usamos la cópula gaussiana, entonces obtenemos que ( X , Y ) son conjuntamente normales, por lo que Z = X + Y se distribuye normalmente. Si la cópula no es la cópula gaussiana, entonces X e Y todavía están distribuidas marginalmente como normales, pero no son conjuntamente normales y, por lo tanto, la suma no se distribuirá normalmente, en general. (X,Y)(X,Y)Z=X+YXY
cardinal

Respuestas:

30

Vea mi comentario sobre la respuesta de probabilistico a esta pregunta . Aquí, dondeσX,Yes lacovarianzadeXyY. Nadie escribe las entradas fuera de la diagonal en la matriz de covarianza comoσ 2 x y como lo ha hecho. Las entradas fuera de la diagonal son covarianzas que pueden ser negativas.

X+YN(μX+μY,σX2+σY2+2σX,Y)aX+bYN(aμX+bμY,a2σX2+b2σY2+2abσX,Y)
σX,YXYσxy2
Dilip Sarwate
fuente
1
@Kodiologist Gracias! Me sorprende que los errores tipográficos hayan pasado desapercibidos durante más de 4 años.
Dilip Sarwate
29

La respuesta de @ dilip es suficiente, pero pensé que agregaría algunos detalles sobre cómo llegar al resultado. Podemos usar el método de funciones características. Para cualquier distribución normal multivariada dimensional X N d ( μ , Σ ) donde μ = ( μ 1 , , μ d ) T y Σ j k = c o v ( X j , X k )dXNd(μ,Σ)μ=(μ1,,μd)T , la función característica viene dada por:Σjk=cov(Xj,Xk)j,k=1,,d

=exp(i d j=1tjμj-1

φX(t)=E[exp(itTX)]=exp(itTμ12tTΣt)
=exp(ij=1dtjμj12j=1dk=1dtjtkΣjk)

YN1(μY,σY2)

φY(t)=exp(itμY12t2σY2)

Z=aTX=j=1dajXj. For your case, we have d=2 and a1=a2=1. The characteristic function for Z is the basically the same as that for X.

φZ(t)=E[exp(itZ)]=E[exp(itaTX)]=φX(ta)
=exp(itj=1dajμj12t2j=1dk=1dajakΣjk)

If we compare this characteristic function with the characteristic function φY(t) we see that they are the same, but with μY being replaced by μZ=j=1dajμj and with σY2 being replaced by σZ2=j=1dk=1dajakΣjk. Hence because the characteristic function of Z is equivalent to the characteristic function of Y, the distributions must also be equal. Hence Z is normally distributed. We can simplify the expression for the variance by noting that Σjk=Σkj and we get:

σZ2=j=1daj2Σjj+2j=2dk=1j1ajakΣjk

This is also the general formula for the variance of a linear combination of any set of random variables, independent or not, normal or not, where Σjj=var(Xj) and Σjk=cov(Xj,Xk). Now if we specialise to d=2 and a1=a2=1, the above formula becomes:

σZ2=j=12(1)2Σjj+2j=22k=1j1(1)(1)Σjk=Σ11+Σ22+2Σ21
probabilityislogic
fuente
2
+1 Thanks for taking the time to write out the details. Can this question be made part of the FAQ?
Dilip Sarwate