Correlación entre X y XY

11

Si tengo dos variables aleatorias independientes X e Y, ¿cuál es la correlación entre X y el producto XY? Si esto se desconoce, me interesaría saber al menos lo que sucede en el caso específico de que X e Y sean normales con media cero, si eso es más fácil de resolver.

Roberto
fuente
44
¿Qué motiva esta pregunta? Me pregunto si sería mejor si también abordamos algo más aquí. ¿Está realizando un estudio en el que ha creado una variable XY por alguna razón?
gung - Restablece a Monica

Respuestas:

13

Solución

Puedo considerar que una solución válida será uno que expresa - si es posible - la correlación en términos de las propiedades separadas de las variables y . Cálculo de la correlación implicará el cálculo de las covarianzas de monomios en y . Es económico hacer esto de una vez. Simplemente observa esoY X YXYXY

  1. Cuando e son independientes e y son potencias, entonces e son independientes;Y i j X i Y jXYijXiYj

  2. La expectativa de un producto de variables independientes es el producto de sus expectativas.

Esto dará a las fórmulas en términos de los momentos de y .YXY

Eso es todo al respecto.


Detalles

Escriba , etc. para los momentos. Por lo tanto, para cualquier número para el cual los cálculos tienen sentido y producen números finitos,i , j , k , lμi(X)=E(Xi)i,j,k,l

Cov(XiYj,XkYl)=E(XiYjXkYl)E(XiYj)E(XkYl)=μi+k(X)μj+l(Y)μi(X)μk(X)μj(Y)μl(Y).

Tenga en cuenta que la varianza de cualquier variable aleatoria es su covarianza consigo misma, por lo que no tenemos que hacer ningún cálculo especial para las varianzas.

Ahora debería ser obvio cómo calcular momentos que involucran monomios, de cualquier potencia, de cualquier número finito de variables aleatorias independientes. Como aplicación, aplique este resultado a la definición de correlación, que es la covarianza dividida por las raíces cuadradas de las varianzas:

Cor(X,XY)=Cov(X1Y0,X1Y1)Cov(X1Y0,X1Y0) Cov(X1Y1,X1Y1)=μ2(X)μ1(Y)μ1(X)2μ1(Y)(μ2(X)μ1(X)2)(μ2(X)μ2(Y)μ1(X)2μ2(Y)2).

Hay varias simplificaciones algebraicas que puede elegir si desea relacionar esto con las expectativas, variaciones y covarianzas de las variables originales, pero llevarlas a cabo aquí no proporcionaría más información.

whuber
fuente
14

Usando la ley de covarianza total e independencia de e , Usando la ley de la varianza total, y nuevamente, independencia, Tenga en cuenta cómoXY

Cov(X,XY)=ECov(X,XY|Y)+Cov(EX|Y,EXY|Y)=E(YCov(X,X))+Cov(EX,YEX)=E(YVarX)+Cov(EX,YEX)=EYVarX.
Var(XY)=EVar(XY|Y)+VarE(XY|Y)=E(Y2(VarX|Y))+Var(Y(EX|Y))=E(Y2VarX)+Var(YEX)=E(Y2)VarX+(EX)2VarY=VarXVarY+(EY)2VarX+(EX)2VarY.
Y puede tratarse como una constante en cualquiera de las expectativas, variaciones o covarianzas condicionales internas anteriores.

A partir de la covarianza y la varianza anteriores, la correlación puede, después de algunas manipulaciones algebraicas, expresarse muy bien en términos de los dos coeficientes de variación como

corr(X,XY)=11+VarY(EY)2(1+(EX)2VarX).

Una comprobación de este resultado por simulación:

> n <- 1e+6
> x <- rexp(n,2)-2
> y <- rnorm(n,mean=5)
> cv2 <- function(x) var(x)/mean(x)^2
> 1/sqrt(1+cv2(y)*(1+1/cv2(x)))
[1] 0.844882
> cor(x,x*y)
[1] 0.8445373
Jarle Tufto
fuente
Bien, pero me gustaría señalar amablemente un par de cosas: 1. En la tercera línea del segundo conjunto de ecuaciones, ¿debería haber un paréntesis como en ? 2. ¿Está seguro de que la persona que hizo la pregunta sigue el razonamiento detrás de los diferentes pasos? Por ejemplo, que es así porque es un hecho. Sugeriría una explicación mínima para algunos de los pasos. E(Y2VarX)+Var(YEX)ECov(X,XY|Y)=EYCov(X,X)Y
Antoni Parellada
1
Sí, agregué algunos paréntesis que faltaban y alguna explicación. Sin embargo, debo admitir que prefiero la respuesta de @whuber.
Jarle Tufto
5

En el caso específico de que X e Y sean variables aleatorias con medias cero, entonces porque . Por lo tanto,ρ(XY,X)=0E(X2Y)=E[E[X2Y|X]]=E[X2E[Y|X]]=0cov(XY,X)=E(X2Y)E(XY).E(X)=0

Kledou
fuente
-2

La correlación lineal entre X y XY será,

Corr (X, XY) = Cov (X, XY) / sqrt (var (X) * var (XY))

Cov (X, XY) = Suma ((X-mean (X)) (XY-mean (XY)) / n

n - tamaño de muestra; var (X) = varianza de X; var (XY) = varianza de XY

Sam Gladio
fuente
1
La pregunta es sobre variables aleatorias , no sobre datos.
whuber
¿Cómo podemos encontrar si 2 variables aleatorias están correlacionadas o no? A través de los datos solo a la derecha. Corrígeme si estoy equivocado. Disculpas
Sam Gladio
Uno calcula la correlación teóricamente, usando propiedades matemáticas de variables aleatorias. Es casi lo mismo que, por ejemplo, calcular la fuerza de un diseño de puente utilizando los principios de la mecánica newtoniana, en comparación con construir puentes y probarlos: existen distintos roles para la teoría y los datos y no deben confundirse entre sí .
whuber