Escuché que se pueden encontrar correlaciones parciales entre variables aleatorias invirtiendo la matriz de covarianza y tomando celdas apropiadas de dicha matriz de precisión resultante (este hecho se menciona en http://en.wikipedia.org/wiki/Partial_correlation , pero sin una prueba) .
¿Por qué es este el caso?
Respuestas:
Cuando una variable aleatoria multivariada tiene una matriz de covarianza no degenerada , el conjunto de todas las combinaciones lineales reales de forman un espacio vectorial real dimensional con base y un producto interno no degenerado dado por(X1,X2,…,Xn) C=(γij)=(Cov(Xi,Xj)) Xi n E=(X1,X2,…,Xn)
Su base dual con respecto a este producto interno , , está definida de manera única por las relacionesE∗=(X∗1,X∗2,…,X∗n)
el delta de Kronecker (igual a cuando y caso contrario).i = j 01 i=j 0
La base dual es de interés aquí porque la correlación parcial de y se obtiene como la correlación entre la parte de que queda después de proyectarla en el espacio abarcado por todos los otros vectores (llamémosla simplemente "residual", ) y la parte comparable de , su residual . Sin embargo, es un vector que es ortogonal a todos los vectores además de y tiene un producto interno positivo con donde debe ser algún múltiplo no negativo de , y de la misma manera paraX j X i X i ∘ X j X j ∘ X ∗ i X i X i X i ∘ X ∗ i X jXi Xj Xi Xi∘ Xj Xj∘ X∗i Xi Xi Xi∘ X∗i Xj . Por lo tanto, escribamos
para números reales positivos y .λ jλyo λj
La correlación parcial es el producto puntual normalizado de los residuos, que no cambia al cambiar la escala:
(En cualquier caso, la correlación parcial será cero siempre que los residuos sean ortogonales, sean o no distintos de cero).
Necesitamos encontrar los productos internos de elementos de base dual. Para este fin, expanda los elementos de base dual en términos de la base original :mi
Entonces por definición
En notación matricial con la matriz de identidad y la matriz de cambio de base, esto indicaB = ( β i j )I =( δyo j) B =( βyo j)
Es decir, , que es exactamente lo que afirma el artículo de Wikipedia. La fórmula anterior para la correlación parcial daB = C- 1
fuente
Aquí hay una prueba con solo cálculos matriciales.
Agradezco la respuesta de whuber. Es muy perspicaz en las matemáticas detrás de la escena. Sin embargo, todavía no es tan trivial cómo usar su respuesta para obtener el signo menos en la fórmula establecida en la wikipedia Correlación parcial # Using_matrix_inversion .
Para obtener este signo menos, aquí hay una prueba diferente que encontré en "Graphical Models Lauriten 1995 Page 130". Simplemente se realiza mediante algunos cálculos matriciales.
La clave es la siguiente identidad matricial: donde , y . E=A-BD - 1 CF=D - 1 CG=BD - 1
Escriba la matriz de covarianza como donde es La matriz de covarianza de y es la matriz de covarianza de . Ω 11 ( X i , X j ) Ω 22 V ∖ { X i , X j }
Deje . Del mismo modo, escriba como P P = ( P 11 P 12 P 21 P 22 )PAGS= Ω- 1 PAGS
Por la identidad de matriz clave,
También sabemos que es la matriz de covarianza de (de Multivariate_normal_distribution # Conditional_distributions ). Por lo tanto, la correlación parcial es Utilizo la notación de que la entrada de la matriz se denota por .(Xi,Xj)| V∖{Xi,Xj}ρXiXj⋅Ω11- Ω12Ω- 122Ω21 ( Xyo, Xj) | V ∖ { Xyo, Xj} (k,l)M[M]kl
Simplemente fórmula de inversión simple de matriz 2 por 2,
Por lo tanto, que es exactamente lo que afirma el artículo de Wikipedia .
fuente
i=j
, entoncesrho_ii V\{X_i, X_i} = -1
, ¿cómo interpretamos esos elementos diagonales en la matriz de precisión?Tenga en cuenta que el signo de la respuesta en realidad depende de cómo defina la correlación parcial. Hay una diferencia entre la regresión de y en las otras variables por separado frente a la regresión de y en las otras variables juntas. Bajo la segunda definición, deje que la correlación entre los residuos y sea . Entonces la correlación parcial de los dos (regresando en y viceversa) es .X j n - 1 X i X j n - 2 ϵ i ϵ j ρ ϵ i ϵ j - ρXi Xj n−1 Xi Xj n−2 ϵi ϵj ρ ϵi ϵj −ρ
Esto explica la confusión en los comentarios anteriores, así como en Wikipedia. La segunda definición se usa universalmente por lo que puedo decir, por lo que debería haber un signo negativo.
Originalmente publiqué una edición en la otra respuesta, pero cometí un error, ¡perdón por eso!
fuente