¿Las variables aleatorias están correlacionadas si y solo si sus rangos están correlacionados?

Suponga que son variables aleatorias continuas con segundos momentos finitos. La versión de población del coeficiente de correlación de rango de Spearman se puede definir como el coeficiente de momento del producto de Pearson ρ de las integrales de probabilidad transforma y , donde son los cdf de e , es decir, $X,Y$ $ρ_s$ $F_X(X)$ $F_Y(Y)$ $F_X,F_Y$ $X$ $Y$

$ρ_s(X,Y)=ρ(F(X),F(Y))$ .

Me pregunto si generalmente se puede concluir que

$ρ(X,Y)≠0↔ρ(F(X),F(Y))≠0$ ?

Es decir, ¿tenemos una correlación lineal si y solo si tenemos una correlación lineal entre los rangos?

Actualización: en los comentarios se dan dos ejemplos de por qué

$\rho(F_X(X),F_Y(Y))=0\rightarrow \rho(X,Y) = 0$

no es cierto en general, incluso si $X$ e $Y$ tienen la misma distribución. Entonces la pregunta debería reformularse como

$\rho(X,Y) = 0 \rightarrow \rho(F_X(X),F_Y(Y))$ ?

También es de gran interés para mí si esto es verdadero / falso si $X$ e $Y$ tienen la misma distribución.

(Nota: si $X$ e $Y$ dependen positivamente del cuadrante, es decir, $δ(x,y)=F_{X,Y}(x,y)−F_X(x)F_Y(y)>0$ entonces la fórmula de covarianza de Hoeffding $Cov(X,Y)=∫∫δ(x,y)dxdy$ produce que $ρ(X,Y)>0$ y $ρ(F(X),F(Y))>0$ )

correlation pearson-r spearman-rho FSpanhel
fuente

Sugerencia: Para obtener una respuesta, piense en lo que sucede con cada medida de correlación bajo una transformación arbitraria estrictamente monotónica.

cardenal

@cardinal: bueno, el rho de Spearman es invariante bajo transformaciones estrictamente monótonas, el coeficiente de correlación lineal clásico cambiará, pero no está claro cómo (?) ... en particular, no sé si el valor de correlación lineal puede cambiar su valor de cero a no cero bajo transformaciones estrictamente monótonas ... pero tal vez me perdí tu punto?

FSpanhel

¡Estás en el camino correcto! Deje y

X \sim N (0, 1)

$X \sim \mathcal{N}(0,1)$

Y = X^{2}

$Y = X^2$ . Ahora, observe las transformaciones estrictamente monótonas de estos dos. No lo he comprobado explícitamente, pero es probable que funcione.

g (z) = \exp (- z / 2)

$g(z) = \exp(-z/2)$

cardenal

Estás en lo correcto. El segundo ejemplo no funciona como pretendía / sospechaba. Sin embargo, el principio general sobre cómo construir tal contraejemplo aún se mantiene. Y sí, este asunto puede vincularse estrechamente con las cópulas. :-)

cardenal

Una vez que haya confirmado sus contraejemplos, considere escribirlos en una respuesta a esta publicación. Estaré encantado de votarlo. Aclamaciones.

cardenal

Respuestas:

Ninguna de las correlaciones siendo cero necesariamente le dice mucho sobre la otra, ya que 'ponderan' los datos, especialmente los datos extremos, de manera bastante diferente. Solo voy a jugar con muestras, pero podrían construirse ejemplos similares con distribuciones bivariadas / cópulas.

1. La correlación de Spearman 0 no implica la correlación de Pearson 0 :

Como se mencionó en la pregunta, hay ejemplos en los comentarios, pero la estructura básica es "construir un caso donde la correlación de Spearman sea 0, luego tomar un punto extremo y hacerlo más extremo sin cambiar la correlación de Spearman"

Los ejemplos en los comentarios lo cubren muy bien, pero solo voy a jugar con un ejemplo más 'aleatorio' aquí. Considere estos datos (en R), que por construcción tienen correlación de Spearman y Pearson 0:

x=c(0.660527211673069, 0.853446087136149, -0.00673848667511427, 
-0.730570343152498, 0.0519171047989013, 0.00190761493801791, 
-0.72628058443299, 2.4453231076856, -0.918072410495674, -0.364060229489348, 
-0.520696233492491, 0.659907250608776)
y=c(-0.0214697990371976, 0.255615059485107, 1.10561181413232, 0.572216886959267, 
-0.929089680725018, 0.530329993414123, -0.219422799586819, -0.425186120279194, 
-0.848952532832652, 0.859700836483046, -0.00836246690850083, 
1.43806947831794)

cor(x,y);cor(x,y,method="sp")
[1] 1.523681e-18
[1] 0

Ahora agregue 1000 a y [12] y reste 0.6 de x [9]; la correlación de Spearman no ha cambiado, pero la correlación de Pearson ahora es 0.1841:

  ya=y
  ya[12]=ya[12]+1000
  xa=x
  xa[9]=xa[9]-.6
  cor(xa,ya);cor(xa,ya,method="sp")
[1] 0.1841168
[1] 0

(Si desea una gran importancia en esa correlación de Pearson, simplemente repita la muestra completa varias veces).

2. La correlación de Pearson 0 no implica la correlación de Spearman 0 :

Aquí hay dos ejemplos con correlación de Pearson cero pero correlación de Spearman distinta de cero (y, de nuevo, si desea una gran importancia en estas correlaciones de Spearman, simplemente repita la muestra completa varias veces).

Ejemplo 1:

 x1=c(rep(-3.4566679074320789866,20),-2:5)
 y1=x1*x1
 cor(x1,y1);cor(x1,y1,method="spe")
[1] -8.007297e-17 
[1] -0.3512699

puntos en una parábola dispuesta para dar 0 Pearson, pero correlación de Spearman distinta de cero

Ejemplo 2

 k=16.881943016134132 
 x2=c(-9:9,-k,k)
 y2=c(-9:9,k,-k)
 cor(x2,y2);cor(x2,y2,method="spe")
[1] -9.154471e-17
[1] 0.4805195

puntos en la línea ay = x, excepto los más pequeños y más grandes que se encuentran en y = -x

En este último ejemplo, la correlación de Spearman puede fortalecerse agregando más puntos en y = x mientras los dos puntos en la parte superior izquierda e inferior derecha son más extremos para mantener la correlación de Pearson en 0.

Glen_b -Reinstate a Monica
fuente