Importancia del coeficiente de correlación promedio

Descargo de responsabilidad: si considera que esta pregunta es demasiado similar a otra, me alegra que se fusione. Sin embargo, no encontré una respuesta satisfactoria en ningún otro lugar (y todavía no tengo la "reputación" de comentar o votar), así que pensé que sería mejor hacer una nueva pregunta yo mismo.

Mi pregunta es esta Para cada uno de los 12 sujetos humanos, he calculado un coeficiente de correlación (rho de Spearman) entre 6 niveles de una variable independiente X y las observaciones correspondientes de una variable dependiente Y. (Nota: los niveles de X no son iguales entre los sujetos). La hipótesis nula es que en la población general, esta correlación es igual a cero. He probado esta hipótesis de dos maneras:

Usando una prueba t de una muestra sobre los coeficientes de correlación obtenidos de mis 12 sujetos.
Al centrar mis niveles de X y las observaciones de Y de manera que para cada participante, media (X) = 0 y media (Y) = 0, y luego calcular una correlación sobre los datos agregados (72 niveles de X y 72 observaciones de Y) .

Ahora, al leer sobre trabajar con coeficientes de correlación (aquí y en otros lugares), he comenzado a dudar si el primer enfoque es válido. Particularmente, he visto aparecer la siguiente ecuación en varios lugares, presentada (aparentemente) como una prueba t para coeficientes de corelación promedio:

t = \frac{r}{S E_{r}} = \frac{\sqrt{n - 2}}{\sqrt{1 - r^{2}}}

$t = \frac{r}{SE_{r}} = \frac{\sqrt{n-2}}{\sqrt{1-r^{2}}}$

donde sería el coeficiente de correlación promedio (y supongamos que lo hemos obtenido usando la transformación de Fisher en los coeficientes por sujeto primero) el número de observaciones. Intuitivamente, esto me parece incorrecto ya que no incluye ninguna medida de la variabilidad entre sujetos. En otras palabras, si tuviera 3 coeficientes de correlación, obtendría el mismo estadístico t si fueran [0.1, 0.5, 0.9] o [0.45 0.5 0.55] o cualquier rango de valores con la misma media ( ) $r$ $n$ $n=3$

Sospecho, por lo tanto, que la ecuación anterior no se aplica de hecho cuando se prueba la importancia de un promedio de coeficientes de correlación, sino cuando se prueba la importancia de un solo coeficiente de correlación basado en observaciones de 2 variables. $n$

¿Alguien podría confirmar esta intuición o explicar por qué está mal? Además, si esta fórmula no se aplica a mi caso, ¿alguien sabe cuál es el enfoque correcto? ¿O tal vez mi propia prueba número 2 ya es válida? Cualquier ayuda es muy apreciada (incluidos los punteros a respuestas anteriores que podría haber perdido o malinterpretado)

correlation statistical-significance fisher-transform Ruben van Bergen
fuente

La de Pearson es insensible a las transformaciones de centrado y escalado, por lo que creo que el centrado es irrelevante para su pregunta. Por ejemplo, cor ( ) = cor ( ) = cor ( ) = cor ( ).

r

$r$

X, Y

$X,Y$

X, Y - \bar{Y}

$X,Y-\bar{Y}$

X, Y + 1000

$X,Y+1000$

X, Y \times 1000

$X,Y\times 1000$

Alexis

Estoy de acuerdo contigo. Es por eso que interpreté centrar como "centrar cada variable por separado antes de juntarlas".

Federico Tedeschi

@FedericoTedeschi ¿No es "centrar cada variable por separado antes de juntarlas" qué significa ?

Y - \bar{Y}

$Y-\bar{Y}$

Alexis

@Alexis Te he respondido al final de mi respuesta (hubiera sido demasiado tiempo escribirlo en un comentario, y también habría tenido que corregirlo varias veces debido al problema WYSINWYG).

Federico Tedeschi

Respuestas:

Un mejor enfoque para analizar estos datos es utilizar un modelo mixto (también conocido como modelo de efectos mixtos, modelo jerárquico) con subjectun efecto aleatorio (intercepción aleatoria o intercepción aleatoria + pendiente). Para resumir una respuesta diferente mía:

Esto es esencialmente una regresión que modela una relación general única mientras permite que esa relación difiera entre los grupos (los sujetos humanos). Este enfoque se beneficia de la agrupación parcial y utiliza sus datos de manera más eficiente.

mkt - Restablecer a Monica
fuente

-1

Supongo que las variables ( 's y ' s) son las mismas para todas las personas (en realidad no estoy seguro de entender lo que quieres decir al decir que los niveles no son iguales en todas las materias: espero que lo seas) refiriéndose a la independencia entre los rangos de las variables, no sobre qué variables se miden para cada individuo). Sí, la fórmula que mostró se aplica al coeficiente de correlación entre dos variables. $12$ $6$ $X$ $6$ $Y$

En su punto 2, habla de normalización: creo que esto tendría sentido si lo hiciera para cada una de las variables separado. Sin embargo, aun así, el problema con este enfoque es que no controla la dependencia dentro del individuo. $6*2$

Creo que su enfoque 1 tampoco es válido, porque sería una prueba entre variables con distribución con solo grados de libertad, por lo que no creo que pueda aplicar el Teorema del límite central en este caso. $6$ $t$ $10$

Tal vez, con números más grandes, podría usar un enfoque de efecto aleatorio, que permita una pendiente aleatoria y al mismo tiempo probar tanto un coeficiente promedio nulo (de en ) como la inexistencia de un coeficiente aleatorio. Sin embargo, creo que 6 variables y 12 observaciones no son suficientes para hacerlo. $X_i$ $Y_i$

Le sugiero que lo vea como una prueba de 6 valores (que se convierten en 12 si también considera valores por debajo de la diagonal) de la matriz de correlación entre las variables (tanto la como la ), es decir, las que están en la diagonal de la segunda (y equivalente del 3er) cuadrante. Por lo tanto, haría una prueba de razón de probabilidad entre el modelo restringido y el no restringido. $12$ $X$ $Y$

@ Alexis Entiendo que centrar , , reemplazándolos con tendría sentido (creo que también tendría sentido dividirlos por sus 's). De esta manera, las variables e (creadas considerando como si fueran ocurrencias de una variable única, y lo mismo para ) tendrían todas una media de . Por el contrario, si construimos dos variables primero (creado considerando $X_1, \dots, X_6$ $Y_1, \dots, Y_6$ $X_1^*=X_1-\bar{X_1}, \dots, X_6^*=X_6-\bar{X_6}, Y_1^*=Y_1-\bar{Y_1}, \dots, Y_6^*=Y_6-\bar{Y_6}$ $SE$ $X^*$ $Y^*$ $X_i^*, 1 \leq i \leq 6$ $Y_i^*$ $0$ $X, Y$ $X_i, 1 \leq i \leq 6$ como si fueran ocurrencias de una variable única, y lo mismo para ), entonces, por supuesto, restar la media (y también dividir por el SE de e ) no cambiaría las cosas. $Y_i$ $X$ $Y$

EDITAR 01/01/18

Let indican la variable y ( ) del individuo. Entonces, supongamos que tenemos: $i$ $j$ $1\leq j\leq 12$

$X_{1j}=Y_{1j}=10, \forall j$ ;

$X_{2j}=Y_{2j}=8, \forall j$ ;

$X_{3j}=Y_{3j}=6, \forall j$ ;

$X_{4j}=Y_{4j}=4, \forall j$ ;

$X_{5j}=Y_{5j}=2, \forall j$ ;

$X_{6j}=-Y_{6j}=j, \forall j$ .

La correlación en este caso debe ser . $0.5428$

Si cada variable, dado que, para , tanto como no tienen variación, tenemos: . En cuanto a , obtenemos los valores (es decir, para las 's: , y exactamente lo contrario para las 's). Como y , obtenemos: , implicando una correlación de . $1 \leq i \leq 5$ $X_i$ $Y_i$ $X_{ij}^*=Y_{ij}^*=0$ $i=6$ $X_{6j}^*=j-6.5, Y_{j6}^*=(13-j)-6.5=6.5-j$ $X$ $-5.5, -4.5, -3.5, -2.5, -1.5, -0.5, 0.5, 1.5, 2.5, 3.5, 4.5, 5.5$ $Y$ $0=-0$ $j-6.5=-(6.5-j)$ $X_{ij}^*=-Y_{ij}^* \forall i,j \rightarrow X^*=-Y^*$ $-1$

Federico Tedeschi
fuente

Estoy de acuerdo con usted si seguimos el segundo procedimiento. Por eso creo que Ruben van Bergen se refería a lo que describí en el primer procedimiento. En este caso, tenemos que: , pero no es generalmente verdad. Estoy editando mi publicación para mostrar un contraejemplo.

c o r (X_{i}, Y_{i}) = c o r (X_{i}^{*}, Y_{i}^{*}), \forall i

$cor(X_i,Y_i)=cor(X_i^*,Y_i^*), \forall i$

c o r (X, Y) = c o r (X^{*}, Y^{*})

$cor(X,Y)=cor(X^*,Y^*)$

Federico Tedeschi

Los valores que dan una correlación de son: ; . No importa si la correlación es realmente , ya que es claramente diferente de .

0.5428

$0.5428$

X = 10, 10, 10, 10, 10, 10, 10, 10, 10, 10, 10, 10, 8, 8, 8, 8, 8, 8, 8, 8, 8, 8, 8, 8, 6, 6, 6, 6, 6, 6, 6, 6, 6, 6, 6, 6, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12

$X=10,10,10,10,10,10,10,10,10,10,10,10,8,8,8,8,8,8,8,8,8,8,8,8,6,6,6,6,6,6,6,6,6,6,6,6,4,4,4,4,4,4,4,4,4,4,4,4,2,2,2,2,2,2,2,2,2,2,2,2,1,2,3,4,5,6,7,8,9,10,11,12$

Y = 10, 10, 10, 10, 10, 10, 10, 10, 10, 10, 10, 8, 8, 8, 8, 8, 8, 8, 8, 8, 8, 8, 8, 6, 6, 6, 6, 6, 6, 6, 6, 6, 6, 6, 6, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 1

$Y=10,10,10,10,10,10,10,10,10,10,10,8,8,8,8,8,8,8,8,8,8,8,8,6,6,6,6,6,6,6,6,6,6,6,6,4,4,4,4,4,4,4,4,4,4,4,4,2,2,2,2,2,2,2,2,2,2,2,2,12,11,10,9,8,7,6,5,4,3,2,1$

0.5428

$0.5428$

- 1

$-1$

Federico Tedeschi

La correlación entre y es . El hecho de que diga que e conduce a es cierto, pero esto solo significa que , eso es algo que ya he escrito.

X^{*} = 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, - 5.5, - 4.5, - 3.5, - 2.5, - 1.5, - 0.5, 0.5, 1.5, 2.5, 3.5, 4.5, 5.5

$X^*=0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,-5.5,-4.5,-3.5,-2.5,-1.5,-0.5,0.5,1.5,2.5,3.5,4.5,5.5$

X^{*} = 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 5.5, 4.5, 3.5, 2.5, 1.5, 0.5, - 0.5, - 1.5, - 2.5, - 3.5, - 4.5, - 5.5

$X^*=0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,5.5,4.5,3.5,2.5,1.5,0.5,-0.5,-1.5,-2.5,-3.5,-4.5,-5.5$

- 1

$-1$

X = 1, \dots, 12

$X=1,\dots, 12$

Y = 12, \dots, 1

$Y=12, \dots, 1$

c o r (X, Y) = c o r (X^{*}, Y^{*}) = - 1

$cor(X,Y)=cor(X^*,Y^*)=-1$

c o r (X_{i}, Y_{i}) = c o r (X_{i}^{*}, Y_{i}^{*})

$cor(X_i,Y_i)=cor(X^*_i,Y^*_i)$

Federico Tedeschi

Por supuesto, : esto es una consecuencia de la invariancia de la correlación con las transformaciones lineales. Esto es algo que ya acordé en mi primer comentario: "Estoy de acuerdo con usted. Por eso interpreté centrar como" centrar cada variable por separado antes de juntarlas "." - Federico Tedeschi 27 de diciembre de 17 a 10:27

c o r (X; Y) = c o r (X - \bar{X}; Y - \bar{Y})

$cor(X;Y)=cor(X-\bar{X};Y-\bar{Y})$

Federico Tedeschi

Quizás, no entiendo qué significa "centrar cada variable por separado antes de unirlas". Para mí, significa está "centrando cada uno variable por separado antes de ponerlos juntos ". ¿Me pueden ayudar a entender nuestra aparente comprensión diferente?

X - \bar{X}

$X - \bar{X}$

X_{1} - \bar{X}, X_{2} - \bar{X}, \dots, X_{n} - \bar{X}

$X_{1} - \bar{X}, X_{2}-\bar{X},\dots, X_{n}-\bar{X}$

Alexis