El análisis entre mercados es un método para modelar el comportamiento del mercado mediante la búsqueda de relaciones entre diferentes mercados. Muchas veces, se calcula una correlación entre dos mercados, por ejemplo, S&P 500 y los bonos del Tesoro estadounidense a 30 años. La mayoría de las veces, estos cálculos se basan en datos de precios, lo cual es obvio para todos que no se ajusta a la definición de series temporales estacionarias.
Dejando a un lado las posibles soluciones (utilizando en su lugar los retornos), ¿el cálculo de la correlación cuyos datos no son estacionarios es incluso un cálculo estadístico válido?
¿Diría que tal cálculo de correlación es poco confiable o simplemente una tontería?
correlation
stationarity
Comerciante de leche
fuente
fuente
Respuestas:
La correlación mide la relación lineal. En el contexto informal, la relación significa algo estable. Cuando calculamos la correlación de muestra para variables estacionarias y aumentamos el número de puntos de datos disponibles, esta correlación de muestra tiende a una correlación verdadera.
Se puede demostrar que para los precios, que generalmente son caminatas aleatorias, la correlación muestral tiende a una variable aleatoria. Esto significa que no importa cuántos datos tengamos, el resultado siempre será diferente.
Tenga en cuenta que intenté expresar la intuición matemática sin las matemáticas. Desde el punto de vista matemático, la explicación es muy clara: los momentos de muestra de procesos estacionarios convergen en probabilidad a constantes. Los momentos de muestra de caminatas aleatorias convergen en integrales de movimiento browniano que son variables aleatorias. Dado que la relación generalmente se expresa como un número y no como una variable aleatoria, la razón para no calcular la correlación para las variables no estacionarias se hace evidente.
Actualización Dado que estamos interesados en la correlación entre dos variables, supongamos primero que provienen del proceso estacionario . La estacionariedad implica que y no dependen de . Entonces correlaciónE Z t c o v ( Z t , Z t - h ) tZt=(Xt,Yt) EZt cov(Zt,Zt−h) t
tampoco depende de , ya que todas las cantidades en la fórmula provienen de la matriz , que no depende de . Entonces el cálculo de la correlación muestralc o v ( Z t ) tt cov(Zt) t
ρ=corr(Xt,Yt)ρ→ρT→∞√
Ahora suponga que no es estacionario. Entonces puede depender de . Entonces, cuando observamos una muestra de tamaño , potencialmente necesitamos estimar diferentes correlaciones . Por supuesto, esto no es factible, por lo que, en el mejor de los casos, solo podemos estimar algunas funciones de como la media o la varianza. Pero el resultado puede no tener una interpretación sensata. c o r r ( X t , Y t ) t T T ρ t ρ tZt c o r r ( Xt, Yt) t T T ρt ρt
Ahora examinemos qué sucede con la correlación de la caminata aleatoria del proceso no estacionario probablemente más estudiada. Llamamos al proceso una caminata aleatoria si , donde es un proceso estacionario. Por simplicidad, suponga que . LuegoZ t = ∑Zt= ( Xt, Yt) Ct=(Ut,Vt)ECt=0Zt= ∑ts = 1( Ut, Vt) dot= ( Ut, Vt) midot= 0
Para simplificar aún más las cosas, suponga que es un ruido blanco. Esto significa que todas las correlaciones son cero para . Tenga en cuenta que esto no restringe a cero.E ( C t C t + h ) h > 0 c o r r ( U t , V t )dot= ( Ut, Vt) mi(CtCt+h) h>0 corr(Ut,Vt)
Entonces
Hasta ahora todo bien, aunque el proceso no es estacionario, la correlación tiene sentido, aunque tuvimos que hacer los mismos supuestos restrictivos.
Ahora, para ver qué sucede con la correlación de muestra, necesitaremos usar el siguiente hecho sobre caminatas aleatorias, llamado teorema del límite central funcional:
s∈[0,1]
Nuevamente, por simplicidad, definamos la correlación de muestra como
Comencemos con las variaciones. Tenemos
Esto va al infinito a medida que aumenta, por lo que llegamos al primer problema, la varianza de la muestra no converge. Por otro lado, el teorema de mapeo continuo junto con el teorema funcional del límite central nos daT
T→∞
Del mismo modo obtenemos
1
Finalmente, para la correlación muestral de nuestra caminata aleatoria, obtenemos
T→∞
Entonces, aunque la correlación está bien definida, la correlación de la muestra no converge hacia ella, como en el caso del proceso estacionario. En cambio, converge a una determinada variable aleatoria.
fuente
Deje ser una caminata aleatoria discreta. Elige un número positivo . Defina los procesos y por , si , y de lo contrario ; y . En otras palabras, comienza idéntico a pero cada vez que eleva por encima de , cambia de signo (de lo contrario, emula a en todos los aspectos).W h PAGS V PAGS( 0 ) = 1 PAGS( t + 1 ) = - P( t ) V( t ) > h PAGS( t + 1 ) = P( t ) V( t ) = P( t ) W( t ) V W V h W
(En esta figura (para ) es azul y es rojo. Hay cuatro interruptores en el signo).h = 5 W V
En efecto, durante períodos cortos de tiempo, tiende a estar perfectamente correlacionado con o perfectamente anticorrelacionado con él; sin embargo, usar una función de correlación para describir la relación entre y no sería útil (una palabra que quizás capta el problema más acertadamente que "no confiable" o "sin sentido").V W V W
Código de Mathematica para producir la figura:
fuente