Para determinar la correlación cruzada entre Sales
y Variable cost
, ambos con estacionalidad mensual, ¿necesito desestacionalizar ambas series?
fuente
Para determinar la correlación cruzada entre Sales
y Variable cost
, ambos con estacionalidad mensual, ¿necesito desestacionalizar ambas series?
La pregunta esencial es, ¿qué problema estás tratando de resolver?
Si tiene la intención de construir un buen modelo para los datos (y luego usar el modelo para pruebas de hipótesis, pronósticos o lo que sea), debe tener en cuenta todos los patrones que existen. Si hay estacionalidad, debe incluir patrones estacionales en su modelo. Si no lo hace, el modelo podría no ser adecuado; podría arrojar resultados de pruebas de hipótesis poco confiables, pronósticos pobres, etc.
Ahora dice que desea determinar (que interpretaré como estimación) la correlación cruzada entre dos series. Entiendo que la correlación cruzada es solo la correlación regular estimada para diferentes rezagos versus derivaciones de las dos series. Para la intuición es suficiente considerar la correlación regular, lo que haré de ahora en adelante. La idea puede llevarse a la perfección de la correlación regular a la correlación cruzada.
Si ambas series de tiempo fueran bivariadas , la correlación muestral correspondería a una correlación poblacional. Por lo tanto, podría tener una estimación puntual significativa, un intervalo de confianza y qué no. Sin embargo, si al menos una de las series de tiempo no es, definir una contraparte de la población de la correlación de la muestra se vuelve difícil, y posteriormente las estimaciones son difíciles de interpretar. Luego se vuelve más fácil especificar un modelo para sus datos y comenzar a hacer preguntas en términos del modelo.
Ahora suponga que ambas series son bivariadas a excepción de los patrones estacionales en sus medios. Luego puede eliminarlos y estimar la correlación de la serie ajustada estacionalmente (que en este punto debería ser aproximadamente bivariada) Pero tenga en cuenta que la correlación que obtiene después del ajuste estacional no informa su pregunta original, "¿Cuál es la correlación entre las dos series?" Por ejemplo, sus dos series podrían tener exactamente el mismo patrón estacional y solo pequeñas variaciones aleatorias a su alrededor. Por lo tanto, las dos series son casi iguales, e intuitivamente pensarías que su correlación debería ser positiva y realmente alta (cercana a la unidad). Pero la correlación de muestra que obtienes después del ajuste estacionalpodría estar entre [-1,1] ya que los componentes de ruido aleatorio (estimado, pero también el verdadero subyacente) de las dos series pueden o no estar correlacionados. Por lo tanto, obtendría una respuesta a una pregunta que realmente no le interesa; no hay garantía de que la respuesta esté cerca de lo que realmente está buscando.
Por lo tanto, le recomiendo que confíe en un modelo completamente especificado (a menos que sus dos series temporales sean bivariadas ) y hacer preguntas en términos del modelo. Por otro lado, si no tiene tiempo para construir un modelo y necesita una respuesta rápida (eso puede suceder), creo que la estimación puntual más relevante de la correlación entre las dos series sería solo la correlación de muestra regular (aunque tiene el problema de no tener una contraparte significativa en la población y su intervalo de confianza sería difícil de definir, como se explicó anteriormente).
Si está regresando dos series temporales (no relacionadas) con estacionalidad, puede obtener lo que se llama correlación espuria . Un ejemplo de eso está disponible aquí
"es importante considerar si existen tendencias significativas en la serie; si ignoramos una tendencia común, podemos estar estimando una regresión espuria, en la que ambos y el las variables parecen estar correlacionadas debido a la influencia en ambos factores omitidos, el paso del tiempo "- fuente
La tendencia común podría ser un patrón de deriva o estacionalidad. Para evitar la correlación espuria, es la piedra angular para blanquear sus datos, eliminando el efecto de la tendencia y la estacionalidad. Luego puede retroceder en los residuos.
Una introducción más formal al problema está disponible aquí.
El enlace a la "solución más formal" parece ir a una página genérica uni. ¿Podría actualizarlo para señalar el artículo, si aún está disponible?
fuente