¿Hay alguna medida de similitud o distancia entre dos matrices de covarianza simétrica (ambas tienen las mismas dimensiones)?
Estoy pensando aquí en análogos a la divergencia KL de dos distribuciones de probabilidad o la distancia euclidiana entre vectores, excepto que se aplica a las matrices. Me imagino que habría bastantes medidas de similitud.
Idealmente, también me gustaría probar la hipótesis nula de que dos matrices de covarianza son idénticas.
Respuestas:
Puede usar cualquiera de las normas (consulte Wikipedia en una variedad de normas; tenga en cuenta que la raíz cuadrada de la suma de las distancias al cuadrado, √∥A−B∥p , se llama norma Frobenius, y es diferente de lanormaL2, que es la raíz cuadrada del mayor valor propio de(A-B)2, aunque por supuesto lo harían generar la misma topología). La distancia KL entre las dos distribuciones normales con las mismas medias (digamos cero) y las dos matrices de covarianza específicas también está disponible enWikipediacomo1∑i,j(aij−bij)2−−−−−−−−−−−−√ L2 (A−B)2 .12[tr(A−1B)−ln(|B|/|A|)]
Editar: si una de las matrices es una matriz implícita en el modelo y la otra es la matriz de covarianza de muestra, entonces, por supuesto, puede formar una prueba de razón de probabilidad entre las dos. Mi colección favorita personal de tales pruebas para estructuras simples se da en Rencher (2002) Métodos de análisis multivariante . Casos más avanzados están cubiertos en el modelo de estructura de covarianza, en el cual un punto de partida razonable es Bollen (1989) Ecuaciones estructurales con variables latentes .
fuente
Denote y Σ 2 sus matrices ambas de dimensión p .Σ1 Σ2 p
Editar: edité la segunda de las dos propuestas. Creo que había entendido mal la pregunta. La propuesta basada en números de condición se usa mucho en estadísticas sólidas para evaluar la calidad del ajuste. Una fuente antigua que pude encontrar es:
Originalmente había incluido la medida de la relación Det:
que sería la distancia Bhattacharyya entre dos distribuciones gaussianas que tienen el mismo vector de ubicación. Debo haber leído originalmente la pregunta como perteneciente a un entorno donde las dos covarianzas provenían de muestras de poblaciones que se suponía que tenían los mismos medios.
fuente
fuente
La distancia de la matriz de covarianza se usa para rastrear objetos en Computer Vision.
La métrica utilizada actualmente se describe en el artículo: "Una métrica para matrices de covarianza" , de Förstner y Moonen.
fuente