Métricas para matrices de covarianza: inconvenientes y fortalezas

11

¿Cuáles son las "mejores" métricas para las matrices de covarianza y por qué? Para mí está claro que Frobenius & c no son apropiados, y las parametrizaciones de ángulos también tienen sus problemas. Intuitivamente, uno podría querer un compromiso entre estos dos, pero también me gustaría saber si hay otros aspectos a tener en cuenta y quizás estándares bien establecidos.

Las métricas comunes tienen varios inconvenientes, ya que no son naturales para las matrices de covarianza, por ejemplo, a menudo no penalizan especialmente las matrices que no son PSD o no se comportan bien wrt rango (considere dos elipsoides de covarianza de bajo rango rotados: me gustaría lo mismo - Gire la rotación intermedia para tener distancias más bajas que el promedio de componentes, que no es el caso con y tal vez Frobenius, aquí). Además, la convexidad no siempre está garantizada. Sería bueno ver estos y otros problemas abordados por una métrica "buena".L1

Aquí hay una buena discusión de algunos problemas, un ejemplo de optimización de red y otro de visión por computadora . Y aquí hay una pregunta similar para obtener otras métricas, pero sin discusión.

Cuarzo
fuente
2
¿Cuál es el propósito de la métrica que busca? ¿Para qué es inapropiada la métrica de Frobenius?
whuber
1
@whuber: Me gustaría obtener una visión general en general antes de imponer demasiadas restricciones. Mi campo es la financiación cuantitativa, donde la mayoría de las personas se adhieren a Frobenius por simplicidad. Las métricas comunes tienen varios inconvenientes, ya que no son naturales para las matrices de covarianza, por ejemplo, no penalizan especialmente las matrices que no son PSD y no se comportan bien en el rango wrt (piense en dos elipsoides de covarianza de bajo rango rotados: me gustaría la rotación intermedia del mismo rango tener distancias más bajas que el promedio de componentes, que no es el caso con y tal vez Frobenius si no me equivoco). Se agregaron algunos enlaces. L1
Quartz
¿Cómo es esa última pregunta a la que hace referencia "más restringida"? Después de todo, todas las matrices de covarianza son simétricas. Parece ser un duplicado perfecto.
whuber
1
Esa es una buena crítica de la otra pregunta. ¿Puedo sugerirle que edite su pregunta (y título) para reflejar el contenido de su último comentario? Eso lo distinguirá claramente del aparente duplicado y ayudará a los encuestados a darle respuestas más apropiadas. (Y no se preocupe por las modificaciones a su propia pregunta: ¿que se espera; el hilo meta es principalmente acerca de la comunidad de edición.)
whuber
1
@kjetilbhalvorsen ¡Esa es una oración provocativa! ¿Podrías ampliar en una respuesta? O proporcionar una referencia del artículo?
Sycorax dice Reinstate Monica

Respuestas:

2

Bueno, no creo que haya una buena métrica o 'la mejor manera' de analizar las matrices de covarianza. El análisis siempre debe estar alineado con su objetivo. Digamos que C es mi matriz de covarianza. La diagonal contiene la varianza para cada parámetro calculado. Entonces, si está interesado en la importancia de los parámetros, el rastreo (C) es un buen comienzo, ya que es su rendimiento general.

Si traza su parámetro y su importancia, puede ver algo como esto:

x1 =  1.0 ±  0.1 
x2 = 10.0 ±  5.0
x3 =  5.0 ± 15.0 <-- non-significant parameter

Si está interesado en su correlación mutua, tal tabla podría arrojar algo interesante:

x1  1.0
x2  0.9  1.0
x3 -0.3 -0.1  1.0
    x1    x2   x3

Cada elemento es el coeficiente de correlación entre el parámetro xi y xj. Del ejemplo, es visible que los parámetros x1 y x2 están altamente correlacionados.

nali
fuente
1

¡Pregunta interesante, estoy lidiando con el mismo problema en este momento! Depende de cómo defina 'mejor', es decir, si está buscando algún valor único promedio para la propagación, o para la correlación entre los datos, etc. Encontré en Press, SJ (1972): Análisis multivariado aplicado, p. 108 que la varianza generalizada, definida como el determinante de la matriz de covarianza, es útil como una medida única para la propagación. Pero si lo que busca es la correlación, tendré que pensar más. Házmelo saber.

Lucozade
fuente
3
Referencia por favor.
Nick Cox