Tengo dos series de tiempo, que se muestran en la trama a continuación:
El gráfico muestra el detalle completo de ambas series de tiempo, pero puedo reducirlo fácilmente a las observaciones coincidentes si es necesario.
Mi pregunta es: ¿Qué métodos estadísticos puedo usar para evaluar las diferencias entre las series de tiempo?
Sé que esta es una pregunta bastante amplia y vaga, pero parece que no puedo encontrar mucho material introductorio sobre esto en ningún lado. Como puedo ver, hay dos cosas distintas para evaluar:
1. ¿Son iguales los valores?
2. ¿Son iguales las tendencias?
¿Qué tipo de pruebas estadísticas sugeriría mirar para evaluar estas preguntas? Para la pregunta 1, obviamente, puedo evaluar los medios de los diferentes conjuntos de datos y buscar diferencias significativas en las distribuciones, pero ¿hay alguna forma de hacerlo que tenga en cuenta la naturaleza de la serie temporal de los datos?
Para la pregunta 2: ¿hay algo como las pruebas de Mann-Kendall que busquen la similitud entre dos tendencias? Podría hacer la prueba de Mann-Kendall para ambos conjuntos de datos y comparar, pero no sé si esa es una forma válida de hacer las cosas, o si hay una mejor manera.
Estoy haciendo todo esto en R, así que si las pruebas que sugieres tienen un paquete R, házmelo saber.
fuente
Respuestas:
Como han dicho otros, debe tener una frecuencia común de medición (es decir, el tiempo entre observaciones). Con eso en su lugar, identificaría un modelo común que describiría razonablemente cada serie por separado. Esto podría ser un modelo ARIMA o un modelo de regresión de múltiples tendencias con posibles cambios de nivel o un modelo compuesto que integra tanto memoria (ARIMA) como variables ficticias. Este modelo común podría estimarse globalmente y por separado para cada una de las dos series y luego uno podría construir una prueba F para probar la hipótesis de un conjunto común de parámetros.
fuente
Considere el
grangertest()
en la biblioteca más pequeña .Es una prueba para ver si una serie de tiempo es útil para pronosticar otra.
Un par de referencias para comenzar:
https://spia.uga.edu/faculty_pages/monogan/teaching/ts/
https://spia.uga.edu/faculty_pages/monogan/teaching/ts/Kgranger.pdf
http://en.wikipedia.org/wiki/Granger_causality
fuente
Acabo de encontrar esto. Su primera respuesta nos traza g los dos conjuntos de la misma escala (en el tiempo) para ver las diferencias visualmente. Has hecho esto y puedes ver fácilmente que hay algunas diferencias evidentes. El siguiente paso es usar un análisis de correlación simple ... y ver qué tan bien están relacionados usando el coeficiente de correlación (r). Si la r es pequeña, su conclusión sería que están débilmente relacionadas y, por lo tanto, no hay comparaciones deseables y un valor mayor si r sugeriría buenas comparaciones entre las dos series. El tercer paso donde hay una buena correlación es probar la significación estadística de la r. Aquí puede utilizar la prueba de Shapiro Welch, que supondría que las dos series se distribuyen normalmente (hipótesis nula) o no (hipótesis alternativa). Hay otras pruebas que puedes hacer, pero déjame esperar que mi respuesta ayude.
fuente
Ajuste una línea recta a ambas señales de series de tiempo usando polyfit. Luego calcule el error cuadrático medio (RMSE) para ambas líneas. El valor obtenido para la línea roja sería bastante menor que el obtenido para la línea gris.
También haga las lecturas en alguna frecuencia común.
fuente