Si e son dos variables aleatorias que solo pueden tomar dos estados posibles, ¿cómo puedo mostrar que implica independencia? Esto va en contra de lo que aprendí en el día en que no implica independencia ...X
La sugerencia dice que comience con y como posibles estados y generalice a partir de ahí. ¿Y puedo hacer eso y mostrar , pero esto no implica independencia?1
Un poco confundido cómo hacer esto matemáticamente, supongo.
covariance
independence
user3604869
fuente
fuente
Respuestas:
Para las variables binarias, su valor esperado es igual a la probabilidad de que sean iguales a uno. Por lo tanto,
E ( X Y ) = P ( X Y = 1 ) = P ( X = 1 ∩ Y = 1 )E ( X ) = P ( X = 1 )E ( Y ) = P ( Y = 1 )
Si los dos tienen cero covarianza, esto significa E ( X Y ) = E ( X ) E ( Y )E(XY)=E(X)E(Y) , lo que significa
P ( X = 1 ∩ Y = 1 ) = P ( X = 1 ) ⋅ P ( Y = 1 )
Es trivial ver que todas las demás probabilidades conjuntas también se multiplican, utilizando las reglas básicas sobre eventos independientes (es decir, si AA y BB son independientes, entonces sus complementos son independientes, etc.), lo que significa que la función de masa conjunta se factoriza, que es la definición de dos variables aleatorias que son independientes.
fuente
Tanto la correlación como la covarianza miden la asociación lineal entre dos variables dadas y no tiene la obligación de detectar ninguna otra forma de asociación.
Por lo tanto, esas dos variables podrían estar asociadas de varias otras formas no lineales y la covarianza (y, por lo tanto, la correlación) no podría distinguir del caso independiente.
Como muy didáctica, artificial y ejemplo no realista, se puede considerar XX de tal manera que P ( X = x ) = 1 / 3P(X=x)=1/3 para x = - 1 , 0 , 1x=−1,0,1 y también considerar Y = X 2Y=X2 . Tenga en cuenta que no solo están asociados, sino que uno es una función del otro. No obstante, su covarianza es 0, ya que su asociación es ortogonal a la asociación que la covarianza puede detectar.
EDITAR
De hecho, como lo indica @whuber, la respuesta original anterior fue en realidad un comentario sobre cómo la afirmación no es universalmente cierta si ambas variables no son necesariamente dicotómicas. ¡Culpa mía!
Así que vamos a matemática. (El equivalente local de "Suit up!" De Barney Stinson)
Caso particular
Si XX e YY fueran dicotómicos, entonces puede suponer, sin pérdida de generalidad, que ambos asumen solo los valores 00 y 11 con probabilidades arbitrarias pp , qq y rr dadas por
P ( X = 1 ) = p ∈ [ 0 , 1 ] P ( Y = 1 ) = q ∈ [ 0 , 1 ] P ( X = 1 , Y= 1 ) = r ∈ [ 0 , 1 ] ,
que caracterizan completamente la distribución conjunta deXyY. Tomando la sugerencia de @ DilipSarwate, observe que esos tres valores son suficientes para determinar la distribución conjunta de(X,Y), ya que
P ( X = 0 , Y = 1 )
Notice that r=P(X=1,Y=1)r=P(X=1,Y=1) might be equal to the product p⋅q=P(X=1)P(Y=1)p⋅q=P(X=1)P(Y=1) , which would render XX and YY independent, since
P(X=0,Y=0)=1−p−q−pq=(1−p)(1−q)=P(X=0)P(Y=0)P(X=1,Y=0)=p−pq=p(1−q)=P(X=1)P(Y=0)P(X=0,Y=1)=q−pq=(1−p)q=P(X=0)P(Y=1).
Yes, rr might be equal to pqpq , BUT it can be different, as long as it respects the boundaries above.
Well, from the above joint distribution, we would have E(X)=0⋅P(X=0)+1⋅P(X=1)=P(X=1)=pE(Y)=0⋅P(Y=0)+1⋅P(Y=1)=P(Y=1)=qE(XY)=0⋅P(XY=0)+1⋅P(XY=1)=P(XY=1)=P(X=1,Y=1)=rCov(X,Y)=E(XY)−E(X)E(Y)=r−pq
Now, notice then that XX and YY are independent if and only if Cov(X,Y)=0Cov(X,Y)=0 . Indeed, if XX and YY are independent, then P(X=1,Y=1)=P(X=1)P(Y=1)P(X=1,Y=1)=P(X=1)P(Y=1) , which is to say r=pqr=pq . Therefore, Cov(X,Y)=r−pq=0Cov(X,Y)=r−pq=0 ; and, on the other hand, if Cov(X,Y)=0Cov(X,Y)=0 , then r−pq=0r−pq=0 , which is to say r=pqr=pq . Therefore, XX and YY are independent.
General Case
About the without loss of generality clause above, if XX and YY were distributed otherwise, let's say, for a<ba<b and c<dc<d ,
P(X=b)=pP(Y=d)=qP(X=b,Y=d)=r
Also, we would have E(X′)=E(X−ab−a)=E(X)−ab−aE(Y′)=E(Y−cd−c)=E(Y)−cd−cE(X′Y′)=E(X−ab−aY−cd−c)=E[(X−a)(Y−c)](b−a)(d−c)=E(XY−Xc−aY+ac)(b−a)(d−c)=E(XY)−cE(X)−aE(Y)+ac(b−a)(d−c)Cov(X′,Y′)=E(X′Y′)−E(X′)E(Y′)=E(XY)−cE(X)−aE(Y)+ac(b−a)(d−c)−E(X)−ab−aE(Y)−cd−c=[E(XY)−cE(X)−aE(Y)+ac]−[E(X)−a][E(Y)−c](b−a)(d−c)=[E(XY)−cE(X)−aE(Y)+ac]−[E(X)E(Y)−cE(X)−aE(Y)+ac](b−a)(d−c)=E(XY)−E(X)E(Y)(b−a)(d−c)=1(b−a)(d−c)Cov(X,Y).
=D
fuente
IN GENERAL:
The criterion for independence is F(x,y)=FX(x)FY(y)F(x,y)=FX(x)FY(y) . Or fX,Y(x,y)=fX(x)fY(y)
"If two variables are independent, their covariance is 0.0. But, having
a covariance of 00 does not imply the variables are independent."
This is nicely explained by Macro here, and in the Wikipedia entry for independence.
independence⇒zero covindependence⇒zero cov , yet
zero cov⇏independence.zero cov⇏independence.
Great example: X∼N(0,1)X∼N(0,1) , and Y=X2.Y=X2. Covariance is zero (and E(XY)=0E(XY)=0 , which is the criterion for orthogonality), yet they are dependent. Credit goes to this post.
IN PARTICULAR (OP problem):
These are Bernoulli rv's, XX and YY with probability of success Pr(X=1)Pr(X=1) , and Pr(Y=1)Pr(Y=1) .
cov(X,Y)=E[XY]−E[X]E[Y]=∗Pr(X=1∩Y=1)−Pr(X=1)Pr(Y=1)⟹Pr(X=1,Y=1)=Pr(X=1)Pr(Y=1).cov(X,Y)=E[XY]−E[X]E[Y]=∗Pr(X=1∩Y=1)−Pr(X=1)Pr(Y=1)⟹Pr(X=1,Y=1)=Pr(X=1)Pr(Y=1).
This is equivalent to the condition for independence in Eq. (1).
(∗):
E[XY]=∗∗∑domain X, YPr(X=x∩Y=y)xy=≠0 iff x×y≠0Pr(X=1∩Y=1).
(∗∗): by LOTUS.
As pointed out below, the argument is incomplete without what Dilip Sarwate had pointed out in his comments shortly after the OP appeared. After searching around, I found this proof of the missing part here:
Similarly. A and Bc are independent events.
So, we have shown already that Pr(X=1,Y=1)=Pr(X=1)Pr(Y=1)
fuente