¿Cuál es su intuición / interpretación de una distribución de valores propios de una matriz de correlación? Tiendo a escuchar que generalmente los 3 valores propios más grandes son los más importantes, mientras que los cercanos a cero son el ruido. Además, he visto algunos trabajos de investigación que investigan cómo las distribuciones de valores propios que ocurren naturalmente difieren de las calculadas a partir de matrices de correlación aleatorias (nuevamente, distinguiendo el ruido de la señal).
Por favor, siéntase libre de elaborar sus ideas.
distributions
correlation
Eduardas
fuente
fuente
Respuestas:
Tiendo a escuchar que generalmente los 3 valores propios más grandes son los más importantes, mientras que los cercanos a cero son ruido
Puedes probar para eso. Consulte el documento vinculado en esta publicación para obtener más detalles. Nuevamente, si se trata de series de tiempo financieras, es posible que desee corregir primero la leptokurticidad (es decir, considere la serie de retornos ajustados por garch, no los retornos sin procesar).
He visto algunos trabajos de investigación que investigan cómo las distribuciones de valores propios que ocurren naturalmente difieren de las calculadas a partir de matrices de correlación aleatorias (de nuevo, distinguiendo el ruido de la señal).
Edward:> Por lo general, uno lo haría de otra manera: mira la distribución multivariada de los valores propios (de las matrices de correlación) que provienen de la aplicación que deseas. Una vez que haya identificado un candidato creíble para la distribución de valores propios, debería ser bastante fácil generar a partir de ellos.
El mejor procedimiento sobre cómo identificar la distribución multivariada de sus valores propios depende de cuántos activos desee considerar simultáneamente (es decir, cuáles son las dimensiones de su matriz de correlación). Hay un buen truco si ( es el número de activos).p ≤ 10 p
Editar (comentarios de Shabbychef)
procedimiento de cuatro pasos:
Una limitación es que el cálculo rápido del casco convexo de una serie de puntos se vuelve extremadamente lento cuando el número de dimensiones es mayor que 10.J≥2
fuente
Los valores propios dan magnitudes de los componentes principales de la propagación de datos.
(fuente: yaroslavvb.com ) El
primer conjunto de datos se generó a partir de Gauss con matriz de covarianza segundo conjunto de datos es el primer conjunto de datos girado por
fuente
Por lo general, el primer portafolio propio tiene una ponderación casi igual en cada nombre, es decir, el portafolio de "mercado" que consiste en todos los activos con pesos iguales en dólares. El segundo portafolio propio puede tener algún significado semántico, dependiendo del período de tiempo que revise: por ejemplo, en su mayoría acciones de energía o acciones bancarias, etc. En mi experiencia, sería difícil hacer una historia del quinto portafolio propio o más allá, y esto depende en alguna parte de la selección del universo y del período de tiempo considerado. Esto está bien porque generalmente el quinto valor propio más o menos no está demasiado lejos de los límites impuestos por la distribución Marchenko-Pastur.
fuente
fuente