Completar una matriz de correlación 3x3: dos coeficientes de los tres dados

20

Me hicieron esta pregunta en una entrevista.

Digamos que tenemos una matriz de correlación de la forma

[10.60.80.61γ0.8γ1]

Me pidieron que encontrara el valor de gamma, dada esta matriz de correlación.
Pensé que podría hacer algo con los valores propios, ya que todos deberían ser mayores o iguales a 0. (La matriz debería ser semidefinida positiva), pero no creo que este enfoque arroje la respuesta. Me estoy perdiendo un truco.

¿Podría dar una pista para resolver lo mismo?

principiante
fuente
Los comentarios no son para discusión extendida; Esta conversación se ha movido al chat .
whuber
1
Una búsqueda en este sitio condujo directamente a uno de (varios) hilos que contienen fórmulas relevantes: stats.stackexchange.com/questions/5747 . También hay algunas tramas útiles en la respuesta de felix s .
whuber

Respuestas:

21

Ya sabemos que está delimitado entre La matriz de correlación debe ser semidefinida positiva y, por lo tanto, sus principales menores no deben ser negativos.[ - 1 , 1 ]γ[1,1]

Por lo tanto,

1(1γ2)0.6(0.60.8γ)+0.8(0.6γ0.8)0γ2+0.96γ0γ(γ0.96)0 and 1γ10γ0.96
derechos
fuente
44
@novice Es posible que desee leer sobre el Criterio de Sylvester
derechos de autor
Gran respuesta. Agregaría lo siguiente: La forma popular de obtener gamma es intentar encontrar la gamma que conduzca a la matriz de correlación de la norma nuclear más pequeña (también conocida como norma ky-fan) posible mientras se resuelven las ecuaciones anteriores. Para obtener más información, busque "terminación de matriz", "detección de compresión" o consulte este informe sobre el tema bit.ly/2iwY1nW .
Mustafa S Eisa
1
Para que esto sea una prueba, necesita un resultado en la otra dirección: si todos los menores líderes no triviales son y la matriz tiene determinante , entonces la matriz es semidefinida positiva. 0>00
Federico Poloni
10

Aquí hay una solución más simple (y quizás más intuitiva):

Piense en la covarianza como un producto interno sobre un espacio vectorial abstracto . A continuación, las entradas de la matriz de correlación son para los vectores v 1 , v 2 , v 3 , en el que el soporte en ángulo v i , v j denota el ángulo entre v i y v j .cosvi,vjv1v2v3vi,vjvivj

No es difícil imaginar que está delimitada por | V 1 , v 2± v 1 , v 3| . El límite en su coseno ( γ ) es por lo tanto cos [v 1 , v 2± v 1 , v 3] . La trigonometría básica da γ [ 0.6 ×v2,v3|v1,v2±v1,v3|γcos[v1,v2±v1,v3] .γ[0.6×0.80.6×0.8,0.6×0.8+0.6×0.8]=[0,0.96]

Editar: Tenga en cuenta que el en la última línea es realmente cos v 1 , v 2cos v 1 , v 3pecado v 1 , v 3pecado v 1 , v 2 - la segunda aparición de 0.6 y 0.8 ocurre por coincidencia gracias a 0.6 2 + 0.8 2 = 10.6×0.80.6×0.8cosv1,v2cosv1,v3sinv1,v3sinv1,v20.62+0.82=1.

yangle
fuente
1
+1, un razonamiento geométrico legítimo (no obstante, no verifiqué tus cálculos). Esto es exactamente lo que he propuesto en los comentarios a la pregunta (desafortunadamente, todos los comentarios fueron movidos por el moderador para chatear, vea el enlace de arriba).
ttnphns
Me parece que has "probado" que todas las correlaciones deben ser no negativas, porque parece que tu cálculo siempre dará cero para el límite inferior. Si ese no es el caso, ¿podría explicar cómo funciona su cálculo en general? Realmente no confío, o tal vez no entiendo, su límite, porque en tres o más dimensiones siempre puede encontrar un para el cual v 1v 2 = v 1v 3 = 0 y luego su límite implica v 2v 3 es siempre cero! (cc @ttnphns)v1v1v2=v1v3=0v2v3
whuber
@whuber: Perdón por la confusión. El cálculo no siempre da cero para el límite inferior. He modificado mi respuesta.
yangle
¿Cómo responde a mi última preocupación? Parece indicar que tus límites son incorrectos.
whuber
@whuber: En su caso, ⟨v1, v2⟩ = ⟨v1, v3⟩ = π / 2, de ahí el límite | ⟨v1, v2⟩ ± ⟨v1, v3⟩ | es [0, π] como se esperaba. El enlace cos⟨v1, v2⟩cos⟨v1, v3⟩∓sin⟨v1, v3⟩sin⟨v1, v2⟩ en γ también resulta ser [-1, 1].
yangle
4

Esto es lo que quise decir en mi comentario inicial a la respuesta y lo que percibo que @yangle podría estar hablando (aunque no seguí / verifiqué su cálculo).

"La matriz debe ser semidefinida positiva" implica que los vectores variables son un grupo en el espacio euclidiano. El caso de la matriz de correlación es más fácil que la matriz de covarianza porque las tres longitudes de los vectores están fijadas en 1. Imagine 3 vectores unitarios XYZ y recuerde que es el coseno del ángulo . Entonces, cos α = r x y = 0.6 , y cos β = r y z = 0.8 . ¿Cuáles podrían ser los límites para cos γ = r x zrcosα=rxy=0.6cosβ=ryz=0.8cosγ=rxz? Esa correlación puede tomar cualquier valor definido por Z circunscribiendo sobre Y (manteniendo el ángulo con él):ryz=0.8

enter image description here

A medida que gira, dos posiciones son notables como wrt X final, ambas son cuando Z cae en el plano XY. Uno está entre X e Y, y el otro está en el lado opuesto de Y. Estos se muestran mediante vectores azules y rojos. En ambas posiciones, exactamente la configuración XYZ (matriz de correlación) es singular. Y estos son el ángulo mínimo y máximo (de ahí la correlación) que Z puede alcanzar wrt X.

Al elegir la fórmula trigonométrica para calcular la suma o diferencia de ángulos en un plano, tenemos:

como los límites.cosγ=rxyryz(1rxy2)(1ryz2)=[0,0.96]

Esta vista geométrica es solo otra (y un caso específico y más simple en 3D) sobre lo que @rightskewed expresó en términos algebraicos (menores, etc.).

ttnphns
fuente
Si X, Y, Z son variables aleatorias, ¿cómo se asignan a los vectores en el espacio 3d (solo pueden ser vectores en el espacio 1d). Además, si los RV son Nx1, ¿serán vectores en el espacio N dimensional?
novicio
@novice Sí, inicialmente son 3 vectores en el espacio Nd, pero solo 3 dimensiones no son redundantes. Siga el segundo enlace en la respuesta y lea más referencias allí al espacio temático donde se explica.
ttnphns
4

Jugar con menores principales puede estar bien en problemas de 3 por 3 o tal vez de 4 por 4, pero se queda sin gasolina y estabilidad numérica en dimensiones más altas.

Para un único problema de parámetro "libre" como este, es fácil ver que el conjunto de todos los valores que forman la matriz psd será un intervalo único. Por lo tanto, es suficiente encontrar el mínimo y el máximo de tales valores. Esto se puede lograr fácilmente resolviendo numéricamente un par de problemas de programación SemiDefinite lineal (SDP):

  1. minimizar γ sujeto a matriz es psd.
  2. maximizar γ sujeto a matriz es psd.

Por ejemplo, estos problemas pueden formularse y resolverse numéricamente utilizando YALMIP en MATLAB.

  1. gamma = sdpvar; A = [1 .6 .8; .6 1 gamma; .8 gamma 1]; optimizar (A> = 0, gamma)
  2. optimizar (A> = 0, -gamma)

Rápido, fácil y confiable.

Por cierto, si el entrevistador de smarty pants que hace la pregunta no sabe que la Programación SemiDefinite, que está bien desarrollada y tiene optimizadores numéricos sofisticados y fáciles de usar para resolver problemas prácticos de manera confiable, puede usarse para resolver este problema, y ​​muchos más. variantes difíciles, dígale que esto ya no es 1870, y es hora de aprovechar los desarrollos computacionales modernos.

Mark L. Stone
fuente
4

Consideremos el siguiente conjunto convexo

{(x,y,z)R3:[1xyx1zyz1]O3}

3

enter image description here

x=0.6y=0.8

enter image description here

El límite del eliptograma es una superficie cúbica definida por

det[1xyx1zyz1]=1+2xyzx2y2z2=0

x=0.6y=0.8

0.96zz2=z(0.96z)=0

Por lo tanto, la intersección del eliptograma con los dos planos es el segmento de línea parametrizado por

{(0.6,0.8,t)0t0.96}
Rodrigo de Azevedo
fuente
1

Toda matriz semi-definida positiva es una matriz de correlación / covarianza (y viceversa).

AAA=UDUTUDB=UD1/2UTD1/2

xBxA

R=E[xxT]R=RTaTRa=E[(aTx)2]0 so the Rayleigh quotient is non-negative for any non-zero a so R is positive semi-definite.

Now, noting that a symmetric matrix is positive semi-definite if and only if its eigenvalues are non-negative, we see that your original approach would work: calculate the characteristic polynomial, look at its roots to see if they are non-negative. Note that testing for positive definiteness is easy with Sylvester's Criterion (as mentioned in another answer's comment; a matrix is positive definite if and only if the principal minors all have positive determinant); there are extensions for semidefinite (all minors have non-negative determinant), but you have to check 2n minors in this case, versus just n for positive definite.

Batman
fuente