¿Por qué LKJcorr es un buen previo para la matriz de correlación?

11

Estoy leyendo el capítulo 13 "Aventuras en covarianza" en el libro ( excelente ) Replanteamiento estadístico de Richard McElreath, donde presenta el siguiente modelo jerárquico:

Modelo

( Res una matriz de correlación)

El autor explica que LKJcorres un previo poco informativo que funciona como un priorizador de regularización para la matriz de correlación. ¿Pero por qué es así? ¿Qué características tiene la LKJcorrdistribución que la hacen tan buena antes de las matrices de correlación? ¿Cuáles son otros buenos antecedentes utilizados en la práctica para las matrices de correlación?

xboard
fuente

Respuestas:

8

La distribución LKJ es una extensión del trabajo de H. Joe (1). Joe propuso un procedimiento para generar matrices de correlación uniformemente sobre el espacio de todas las matrices de correlación definidas positivas. La contribución de (2) es que amplía el trabajo de Joe para mostrar que hay una manera más eficiente de generar tales muestras.

La parametrización comúnmente utilizada en software como Stan le permite controlar qué tan cerca se parecen las matrices muestreadas a las matrices de identidad. Esto significa que puede pasar sin problemas de las matrices de muestreo que están muy cerca de a las matrices que son más o menos uniformes sobre las matrices PD.yo

Una forma alternativa de muestreo a partir de matrices de correlación, llamada método "cebolla", se encuentra en (3). (Probablemente no tenga relación con la revista satírica de noticias).

Otra alternativa es tomar muestras de las distribuciones de Wishart, que son semi-definidas positivas, y luego dividir las variaciones para dejar una matriz de correlación. El problema con las distribuciones de tipo Wishart es que las variedades no informativas son singulares o numéricamente singulares con alta probabilidad, por lo que los métodos de muestreo son lentos cuando se requiere que la muestra sea (numérica) no singular.

(1) H. Joe. "Generación de matrices de correlación aleatorias basadas en correlaciones parciales". Journal of Multivariate Analysis , 97 (2006), págs. 2177-2189

(2) Daniel Lewandowski, Dorota Kurowicka, Harry Joe. "Generación de matrices de correlación aleatorias basadas en vides y método de cebolla extendida". Journal of Multivariate Analysis , Volumen 100, Número 9, 2009, páginas 1989-2001

(3) S. Ghosh, SG Henderson. "Comportamiento del método norta para la generación de vectores aleatorios correlacionados a medida que aumenta la dimensión". Transacciones de ACM sobre modelado y simulación por computadora (TOMACS), 13 (3) (2003), pp. 276-294

Sycorax dice reinstalar a Mónica
fuente