¿Cuáles son las "mejores" métricas para las matrices de covarianza y por qué? Para mí está claro que Frobenius & c no son apropiados, y las parametrizaciones de ángulos también tienen sus problemas. Intuitivamente, uno podría querer un compromiso entre estos dos, pero también me gustaría saber si hay otros aspectos a tener en cuenta y quizás estándares bien establecidos.
Las métricas comunes tienen varios inconvenientes, ya que no son naturales para las matrices de covarianza, por ejemplo, a menudo no penalizan especialmente las matrices que no son PSD o no se comportan bien wrt rango (considere dos elipsoides de covarianza de bajo rango rotados: me gustaría lo mismo - Gire la rotación intermedia para tener distancias más bajas que el promedio de componentes, que no es el caso con y tal vez Frobenius, aquí). Además, la convexidad no siempre está garantizada. Sería bueno ver estos y otros problemas abordados por una métrica "buena".
Aquí hay una buena discusión de algunos problemas, un ejemplo de optimización de red y otro de visión por computadora . Y aquí hay una pregunta similar para obtener otras métricas, pero sin discusión.
fuente
Respuestas:
Bueno, no creo que haya una buena métrica o 'la mejor manera' de analizar las matrices de covarianza. El análisis siempre debe estar alineado con su objetivo. Digamos que C es mi matriz de covarianza. La diagonal contiene la varianza para cada parámetro calculado. Entonces, si está interesado en la importancia de los parámetros, el rastreo (C) es un buen comienzo, ya que es su rendimiento general.
Si traza su parámetro y su importancia, puede ver algo como esto:
Si está interesado en su correlación mutua, tal tabla podría arrojar algo interesante:
Cada elemento es el coeficiente de correlación entre el parámetro xi y xj. Del ejemplo, es visible que los parámetros x1 y x2 están altamente correlacionados.
fuente
¡Pregunta interesante, estoy lidiando con el mismo problema en este momento! Depende de cómo defina 'mejor', es decir, si está buscando algún valor único promedio para la propagación, o para la correlación entre los datos, etc. Encontré en Press, SJ (1972): Análisis multivariado aplicado, p. 108 que la varianza generalizada, definida como el determinante de la matriz de covarianza, es útil como una medida única para la propagación. Pero si lo que busca es la correlación, tendré que pensar más. Házmelo saber.
fuente