Considere el siguiente gráfico:
La línea roja (eje izquierdo) describe el volumen de negociación de una determinada acción. La línea azul (eje derecho) describe el volumen del mensaje de Twitter para ese stock. Por ejemplo, el 9 de mayo (05-09) se realizaron 1.100 millones de intercambios y 4.000 tweets.
Me gustaría calcular si existe una correlación entre las series de tiempo, ya sea en el mismo día o con un retraso, por ejemplo: el volumen de tweets se correlaciona con el volumen de operaciones un día después. Estoy leyendo muchos artículos que han realizado dicho análisis, por ejemplo, Correlacionar series financieras financieras con actividad de microblogging , pero no describen cómo se realiza dicho análisis en términos prácticos. Lo siguiente se afirma en el artículo:
Sin embargo, tengo muy poca experiencia con el análisis estadístico y no sé cómo ejecutar esto en la serie que tengo. Uso SPSS (también conocido como PASW) y mi pregunta es: ¿cuáles son los pasos a seguir para realizar dicho análisis desde el punto en que tengo un archivo de datos subyacente a la imagen de arriba? ¿Es esta prueba una característica predeterminada (y cómo se llama) y / o cómo podría ejecutarla?
Cualquier ayuda sería muy apreciada :-)
fuente
Respuestas:
Dos verifican la normalidad bivariada verifican tres cosas:
Para verificar la normalidad en cada uno de estos pasos, use gráficos qq normales o puede usar cualquier prueba de hipótesis de normalidad.
O, alternativamente, podría verificar si cada combinación lineal posible (coeficientes reales) de las dos series es marginalmente normal. Sin embargo, eso probablemente sería difícil.
Editar: (6 años después) Guardaré lo anterior para la posteridad, pero tenga en cuenta que tengo una respuesta más reciente a una pregunta similar aquí .
fuente
El coeficiente de correlación entre series de tiempo es inútil. Consulte COEFICIENTE DE CORRELACIÓN: valores críticos para la importancia de la prueba . Esto fue señalado por primera vez por U. Yule en 1926 Yule, GU, 1926, "¿Por qué a veces obtenemos correlaciones sin sentido entre series de tiempo? Un estudio de muestreo y la naturaleza de las series de tiempo", Journal of the Royal Statistical Society 89, 1 –64 . Es posible que desee google "por qué obtenemos correlación sin sentido" para más.
La razón de esto es que las pruebas de correlación requieren normalidad articular. La normalidad conjunta requiere que cada serie sea normal. La normalidad requiere independencia. Para examinar la relación entre series temporales, revise la Identificación de la función de transferencia en cualquier buen libro de series temporales como Análisis de series temporales: métodos univariados y multivariados, por William WS Wei, David P. Reilly .
Respuesta al desafío
En términos de una respuesta a su desafío. Es bien sabido por algunos ( Yule, GU, 1926 ) que la correlación de dos series de tiempo puede ser defectuosa, particularmente si cualquiera de las series se ve afectada por pulsos / cambios de nivel / pulsos estacionales y / o tendencias de tiempo local. Siendo ese el caso, tomaría cada una de las series POR SEPARADO e identificaría la estructura ARIMA y cualquier pulso / cambio de nivel / pulso estacional y / o tendencias de tiempo local que puedan aplicarse y crear un proceso de error.
Con dos procesos de error limpio, uno para cada una de las dos series originales, calcularía la correlación cruzada que luego podría usarse para medir el grado de asociación por encima y más allá de la estructura auto-correlativa dentro de cada serie. Esta solución se llama apropiadamente el doble enfoque de pre-blanqueamiento.
Ver:
fuente