¿Tiene sentido que una correlación parcial sea mayor que una correlación de orden cero?

14

Esto probablemente demuestra una falta fundamental de comprensión de cómo funcionan las correlaciones parciales.

Tengo 3 variables, x, y, z. Cuando controlo para z, la correlación entre x e y aumenta sobre la correlación entre x e y cuando no se controlaba z.

¿Esto tiene sentido? Tiendo a pensar que cuando uno controla el efecto de una tercera variable, la correlación debería disminuir.

¡Gracias por tu ayuda!

evt
fuente
No puedo superar lo que ha hecho probablementeislogic, pero para un tratamiento con luz que ofrece ejemplos ilustrativos y no requiere matemática, vea integrativestatistics.com/partial.htm
rolando2

Respuestas:

7

Mirando la página de Wikipedia, tenemos la correlación parcial entre e Y dado que Z viene dado por:XYZ

ρXY|Z=ρXYρXZρYZ1ρXZ21ρYZ2>ρXY

Entonces simplemente requerimos

ρXY>ρXZρYZ11ρXZ21ρYZ2

El lado derecho tiene un mínimo global cuando . Este mínimo global es - 1 . Creo que esto debería explicar lo que está sucediendo. Si la correlación entre Z e Y es el signo opuesto a la correlación entre Z e X (pero la misma magnitud), entonces la correlación parcial entre X e Y dado Z siempre será mayor o igual a la correlación entre X e YρXZ=ρYZ1ZYZXXYZXY. En cierto sentido, la correlación condicional "más" y "menos" tiende a cancelarse en la correlación incondicional.

ACTUALIZAR

Revisé un poco con R, y aquí hay un código para generar algunas parcelas.

partial.plot <- function(r){  
  r.xz<- as.vector(rep(-99:99/100,199))  
  r.yz<- sort(r.xz)  
  r.xy.z <- (r-r.xz*r.yz)/sqrt(1-r.xz^2)/sqrt(1-r.yz^2)  
  tmp2 <- ifelse(abs(r.xy.z)<1,ifelse(abs(r.xy.z)<abs(r),2,1),0)  
  r.all <-cbind(r.xz,r.yz,r.xy.z,tmp2)  
  mycol <- tmp2  
  mycol[mycol==0] <- "red"  
  mycol[mycol==1] <- "blue"  
  mycol[mycol==2] <- "green"  
  plot(r.xz,r.yz,type="n")  
  text(r.all[,1],r.all[,2],labels=r.all[,4],col=mycol)  
}

por lo tanto, envíe parcial.plot (0.5) para ver cuándo una correlación marginal de 0.5 corresponde a una correlación parcial. La trama está codificada por colores para que el área roja represente la correlación parcial "imposible", el área azul donde y el área verde donde 1 > | ρ | > | ρ X Y | Z | A continuación se muestra un ejemplo para ρ X Y = r = 0.5|ρ|<|ρXY|Z|<11>|ρ|>|ρXY|Z|ρXY=r=0.5

Correlación parcial cuando la correlación marginal es 0.5

probabilidadislogica
fuente
El código no me funciona. La línea 5 se ve extraña y Emacs me dice que faltan algunos paréntesis.
Bernd Weiss el
Falta un "retorno": debe haberlo eliminado accidentalmente. debería estar bien ahora.
probabilityislogic
rxz
perro se fue! necesito arreglar mi código ... otra vez - plot () está mal. Ah, el glorioso tedio del código informático
probabilidad
2

Creo que necesitas saber sobre las variables de moderador y mediador. El artículo clásico es Baron and Kenny [citado 21,659 veces]

Una variable moderadora

"En términos generales, un moderador es una variable cualitativa (por ejemplo, sexo, raza, clase) o cuantitativa (por ejemplo, nivel de recompensa) que afecta la dirección y / o fuerza de la relación entre una variable independiente o predictiva y una variable dependiente o variable de criterio. Específicamente dentro de un marco de análisis correlacional, un moderador es una tercera variable que afecta la correlación de orden cero entre otras dos variables ... En los términos más familiares de análisis de varianza (ANOVA), se puede representar un efecto moderador básico como una interacción entre una variable independiente focal y un factor que especifica las condiciones apropiadas para su funcionamiento ". pag. 1174

Una variable mediadora

"En general, se puede decir que una variable dada funciona como mediador en la medida en que explica la relación entre el predictor y el criterio. Los mediadores explican cómo los eventos físicos externos adquieren importancia psicológica interna. Mientras que las variables moderadoras especifican cuándo ciertos efectos se sostendrá, los mediadores hablan de cómo o por qué ocurren tales efectos ". pag. 1176

Parbury
fuente
44
¿Podría explicar cómo la distinción entre mediadores y moderadores es relevante para determinar si una correlación parcial puede ser mayor que una correlación de orden cero?
Jeromy Anglim