Estoy trabajando extensamente con modelos de series de tiempo financieras, principalmente AR (I) MA y Kalman.
Un problema que sigo enfrentando es la frecuencia de muestreo. Inicialmente, pensaba que si se me ofrecía la posibilidad de tomar muestras con mayor frecuencia de un proceso subyacente, debería tomar muestras con la mayor frecuencia posible para tener una cantidad mucho mayor de muestras, por lo tanto, los parámetros de mi modelo tendrán menos variación.
En realidad, esta idea no resultó ser buena. Lo que sucedió es que si el proceso subyacente no exhibe suficiente variación, aumentar la frecuencia de muestreo en realidad significaría obtener muchos valores repetidos (iguales). Y construir un modelo sobre tales valores da como resultado modelos con coeficientes de modelo muy muy pequeños que no predicen bien en el futuro (por supuesto, la definición de "bien" es subjetiva y una mayor frecuencia requiere predecir muchos más pasos de muestra en el futuro para lograr el mismo paso de tiempo en una configuración de frecuencia más baja). El modelo aprende lo que más encuentra: una línea plana.
Quería hacer un enfoque de muestreo adaptativo, es decir, muestrear con mayor frecuencia cuando hay variación, y con menos frecuencia cuando no la hay. Sin embargo, esto no es fácil. En primer lugar, no está claro qué tipo de sesgo estoy introduciendo al hacerlo (y diferirá según cómo active la muestra / omisión). En segundo lugar, los modelos de series temporales como ARIMA no son adecuados para pasos de muestra desiguales.
¿Hay una buena manera de lidiar con este problema? También me hace preguntarme cómo se logra una transición perfecta entre los modelos de tiempo continuo y los modelos de tiempo discreto si los modelos se ven tan dramáticamente afectados por la frecuencia de muestreo (especialmente cuando los pasos de tiempo se hacen cada vez más pequeños). Cualquier apuntador a recursos externos también será apreciado.
Gracias
fuente
Respuestas:
Es posible que los ARIMA no se adapten bien a su propósito, pero los modelos de espacio de estado son: puede tomar muestras con la frecuencia que desee (y, en principio, cuanto más mejor) y realizar una actualización temporal a intervalos fijos, como la dinámica de su proceso asumido puede exigir Una de las bellezas de los modelos de espacio de estado es que el proceso de observación es independiente del proceso del modelo, y se pueden usar intervalos de tiempo separados para cada uno.
fuente
Me gustaría señalarle el artículo.
Ghysels, E, P. Santa-Clara y R. Valkanov (2006): "Predicción de la volatilidad: aprovechando al máximo los datos de retorno muestreados en diferentes frecuencias", Journal of Econometrics, vol. 131, págs. 59-95.
Los autores emplean una técnica llamada MIDAS (muestreo de datos mixtos) por sí mismos para comparar las estimaciones de volatilidad basadas en datos muestreados a diferentes frecuencias. Es cierto que esto no es exactamente lo que estaba buscando, pero los autores afirman que su técnica es adecuada para comparar los resultados de manera significativa. Tal vez esto le brinde al menos una segunda forma de analizar sus datos. Parece que, en particular en el campo de la macroeconomía, este enfoque ha ganado cierto interés.
fuente
Eso podría funcionar en la muestra, pero sería difícil de usar para las predicciones fuera de la muestra, a menos que descubra cómo predecir la variabilidad en sí (y eso no tiene por qué ser imposible). Además, si encuentra regímenes con baja variación (o ninguna variación) seguidos de regímenes de alta variación, naturalmente necesitaría modelos separados para los dos; Tener un modelo para todo el proceso y tomar muestras a intervalos / frecuencias desiguales parecería intuitivamente subóptimo. Usted mencionó los modelos de cambio de régimen (al responder mi comentario), y eso es una buena ilustración de lo que podría necesitar aquí.
Esto no es enteramente verdad. En una configuración de series de tiempo, lo que importa es el lapso de tiempo en lugar del número de observaciones. Por ejemplo, 120 observaciones mensuales (que abarcan 10 años) es una muestra más informativa que 209 observaciones semanales (que abarcan 4 años) cuando se prueba la presencia de una raíz unitaria; vea esta publicación de blog de Dave Giles y la última referencia en ella. O considere un caso limitante donde muestree con tanta frecuencia que esencialmente mida lo mismo varias veces. Eso aumentaría el tamaño de la muestra, pero no aportaría nueva información, lo que daría una impresión espuria de la precisión estimada. Entonces, ¿quizás no debería dedicar demasiado tiempo a aumentar la frecuencia de muestreo y construir algunos modelos correspondientes?
fuente