Significado de correlación parcial

9

De Wikipedia

Formalmente, la correlación parcial entre e dado un conjunto de variables de control , escrita ρ_ {XY · Z} , es la correlación entre los residuos RX y RY resultantes de regresión lineal de X con Z y de Y con Z , respectivamente.XYnZ={Z1,Z2,,Zn}ρXY·ZRXRYXZYZ

  1. Dice antes que

    La correlación parcial mide el grado de asociación entre dos variables aleatorias, con el efecto de un conjunto de variables aleatorias de control eliminadas.

    Me preguntaba cómo se relaciona la correlación parcial ρXY·Z con la correlación entre X e Y condicional en Z ?

  2. Hay un caso especial para n=1 .

    De hecho, la correlación parcial de primer orden (es decir, cuando n=1 ) no es más que una diferencia entre una correlación y el producto de las correlaciones removibles dividido por el producto de los coeficientes de alienación de las correlaciones removibles. El coeficiente de alienación y su relación con la varianza conjunta a través de la correlación están disponibles en Guilford (1973, pp. 344-345).

    Me preguntaba cómo escribir matemáticamente lo anterior.

Tim
fuente

Respuestas:

7

Tenga en cuenta que la correlación condicional en es una variable que depende de , mientras que la correlación parcial es un número único.ZZ

Además, la correlación parcial se define en función de los residuos de la regresión lineal. Por lo tanto, si la relación real es no lineal, la correlación parcial puede obtener un valor diferente de la correlación condicional, incluso si el condicional correlación en es una constante independiente de . Por otro lado, si son gaussianos multivariados, la correlación parcial es igual a la correlación condicional.ZZX,Y,X

Para un ejemplo donde la correlación condicional constante correlación parcial: No importa qué valor tome , la correlación condicional será -1. Sin embargo, las regresiones lineales , serán constantes 0 y, por lo tanto, los residuales serán los valores , mismos. Por lo tanto, la correlación parcial es igual a la correlación entre , ; que no es igual a -1, ya que claramente las variables no están perfectamente correlacionadas si no se conoce.

ZU(1,1), X=Z2+e, Y=Z2e, eN(0,1),eZ.
ZX|ZY|ZXYXYZ

Aparentemente, Baba y Sibuya (2005) muestran la equivalencia de correlación parcial y correlación condicional para algunas otras distribuciones además del gaussiano multivariante, pero no leí esto.

La respuesta a su pregunta 2 parece existir en el artículo de Wikipedia, la segunda ecuación en Usar fórmula recursiva .

Juho Kokkala
fuente