Intuición detrás de los nombres de correlaciones 'parciales' y 'marginales'

12

¿Alguien tiene una idea de por qué la correlación condicional entre 2 variables se llama correlación "parcial" y la correlación simple entre ellas (entonces, cuando no está condicionada por ninguna otra variable) se llama correlación "marginal"? ¿Cuál es la intuición detrás de las palabras "parcial" y "marginal"? ¿Qué hacen con "partes" o "márgenes"?

Sería bueno aprender la respuesta para comprender mejor esos conceptos.

usuario35159
fuente
Relacionado: stats.stackexchange.com/questions/56969/…
kjetil b halvorsen

Respuestas:

11

El término "marginal" es muy antiguo. Si retrocede lo suficiente en la historia, no hubo revistas científicas (evidentemente, comenzaron alrededor de 1665 ). En cambio, los resultados provisionales se comunicaron a través de cartas escritas a mano, y los resultados finales se escribieron en libros. No solía haber mucho gráfico de datos antes de Playfair , pero los libros a menudo pueden tener tablas con números en diferentes condiciones. Considere esta tabla:

ABCDIxI,AxI,BxI,CxI,DIIxII,AxII,BxII,CxII,DIIIxIII,AxIII,BxIII,CxIII,DIVxIV,AxIV,BxIV,CxIV,D
xI,AIAIx

¿Qué tienen que ver esos números con las correlaciones? Bueno, no es una conexión directa, pero una vez que tiene la idea de "no tener en cuenta otras variables", y tiene un nombre para eso ("marginal"), cuando surge un nuevo contexto que es análogo (es decir, correlaciones) , el nombre y la idea simplemente se aplican.


No conozco la etimología de las correlaciones parciales, pero puedo darte la intuición. En realidad, es bastante sencillo: se trata de la correlación entre parte de una variable y parte de otra. Considere esta figura:

ingrese la descripción de la imagen aquí

XYZr2XYXZYZXYZ

Me gusta esta página web por proporcionar una discusión fácil de entender sobre correlaciones parciales y temas relacionados. Solo la primera sección trata sobre correlaciones parciales per se, pero recomiendo leer toda la página (aunque sea bastante larga). Aunque no está directamente relacionado, la discusión en este hilo: ¿Dónde está la varianza compartida entre todos los IV en una ecuación de regresión múltiple lineal? , puede ser útil también.

gung - Restablece a Monica
fuente
1
ρ(X,Y)=ρ(Y,X)ρXY|Z=ρYX|ZρYX|Z=Area(1)Area(X(2+center))ρXY|ZρYX|ZXYXY
1
Esa probablemente debería ser una nueva pregunta, @KiranK. Es una buena pregunta y no queremos que quede enterrado en comentarios donde la gente nunca lo encontrará.
gung - Restablece a Monica
Buena idea, publiqué una pregunta aquí: stats.stackexchange.com/questions/195410/…
Kiran K.
0

ρXYX,Y

ρXYZX,YZ

ρXYZ:=ρXYρXZρYZ1ρXZ21ρYZ2

Para ilustrar las propiedades que provienen de esta definición, podemos considerar dos casos límite:

  • XYZ

    ρXYZ=ρXY

  • YZρXY

ρXYZ=0

Sebapi
fuente