Tengo una serie diaria bastante predecible con estacionalidad semanal. Puedo hacer predicciones que parecen ser bastante precisas (confirmadas por validación cruzada) cuando no hay vacaciones. Sin embargo, cuando hay vacaciones, tengo los siguientes problemas:
- En mi pronóstico obtengo números distintos de cero para las vacaciones, a pesar de que todas las vacaciones históricas son 0. Sin embargo, este no es el problema principal. El problema es ...
- Dado que el procesamiento que no ocurre en los días festivos "se extiende" a los días posteriores a los días festivos, una variable ficticia simple no lo reduce, ya que estos valores atípicos parecen ser innovadores a corto plazo. Si no hubiera estacionalidad semanal, tal vez podría llegar a una estimación para distribuir los datos no procesados sobre el feriado durante los cinco o más días posteriores al feriado (como se sugiere en ¿Cómo se crean variables que reflejen el impacto de adelanto y rezago de los feriados? / efectos de calendario en un análisis de series de tiempo? ). Sin embargo, la distribución del "desbordamiento" depende del día de la semana en que ocurre el feriado y de si el feriado es Navidad o Día de Acción de Gracias, donde los pedidos se realizan a una tasa menor que el resto del año.
Aquí hay algunas instantáneas de mi validación cruzada que muestran el resultado predicho (azul) versus el resultado real (rojo) para las vacaciones que aparecen en diferentes días de la semana:
También me preocupa que el impacto de la Navidad dependa del día de la semana en que caiga, y solo tengo seis años de datos históricos.
¿Alguien tiene alguna sugerencia sobre cómo lidiar con este tipo de valores atípicos innovadores en el contexto de los pronósticos? (Desafortunadamente no puedo compartir ningún dato)
fuente
Respuestas:
¿No podría crear una variable ficticia para vacaciones, una para vacaciones + 1 y otra para vacaciones + 2 y solo establecerlas en 1 siempre que caigan en un día laborable?
En cuanto a Acción de Gracias y Navidad, la introducción de variables ficticias separadas para estas vacaciones parece ser su peor opción (ya que solo tiene seis años de datos). Sin embargo, en cierta medida, esa podría ser su única opción: las personas simplemente se comportan de manera diferente en esas vacaciones que, por ejemplo, el 4 de julio (y si está estudiando, por ejemplo, los patrones de ventas minoristas, entonces definitivamente simplemente tiene que vivir con esos siendo vacaciones "especiales" y definitivamente querría analizarlas por separado). Sin embargo, quizás las siguientes ideas sean útiles para usted:
Espero que esto ayude.
fuente