No estoy tan familiarizado con el análisis de datos de series temporales. Sin embargo, tengo lo que creo que es una tarea de predicción simple para abordar.
Tengo alrededor de cinco años de datos de un proceso generador común. Cada año representa una función monotónicamente creciente con un componente no lineal. Tengo recuentos por semana durante un ciclo de 40 semanas por año. El proceso comienza, la función comienza en cero, aumenta bastante rápido durante la primera mitad de la función, disminuyendo la velocidad durante la segunda mitad antes de nivelar durante las últimas cinco semanas. El proceso es consistente a lo largo de los años con pequeñas diferencias en la tasa de cambio y el volumen en los segmentos de un año a otro.
Donde igual al recuento en el tiempo x.
El objetivo es tomar en t x (o mejor t 0 a t x , o la pendiente hasta ese punto) y predecir el N en t 40 . Por ejemplo, si N t 10 es 5000, ¿cuál es el valor esperado de N t 40 para ese año? Entonces, la pregunta es, ¿cómo modelaría esos datos? Es bastante fácil resumir y visualizar. Pero me gustaría un modelo para facilitar las predicciones e incorporar una medida de error.
fuente
Respuestas:
Probablemente, el enfoque más simple es, como sugirió Andy W, utilizar un modelo de serie temporal univariante estacional. Si usa R, intente con
auto.arima()
oets()
desde el paquete de pronóstico .Cualquiera de los dos debería funcionar bien, pero un método de serie temporal general no utiliza toda la información proporcionada. En particular, parece que conoce la forma de la curva en cada año, por lo que sería mejor usar esa información modelando los datos de cada año en consecuencia. Lo que sigue es una sugerencia que intenta incorporar esta información.
Parece que algún tipo de curva sigmoidal hará el truco. por ejemplo, una logística desplazada: para el añoty lasemanajdondeat,btyrtson parámetros a estimar. rtes el máximo asintótico,atcontrola la tasa de aumento ybtes el punto medio cuandoft,j=rt/2
Los parámetros se pueden estimar utilizando mínimos cuadrados para cada año. Los parámetros de cada forma de series de tiempo: , b 1 , ... , b n y r 1 , ... , r n . Estos pueden pronosticarse utilizando métodos de series de tiempo estándar, aunque con n = 5 probablemente no pueda hacer mucho más que usar la media de cada serie para producir pronósticos. Entonces, por año 6, una estimación del valor en la semana j es simplemente f ( 6 , juna1, ... , unnorte si1, ... , bnorte r1, ... , rnorte n = 5 j dondese utilizanlos pronósticos de a 6 , b 6 y r 6 .F^( 6 , j ) una6 6 si6 6 r6 6
Una vez que comiencen a observarse los datos para el año 6, querrá actualizar esta estimación. A medida que se obtiene cada nueva observación, calcule la curva sigmoidal a los datos del año 6 (para comenzar, necesitará al menos tres observaciones, ya que hay tres parámetros). Luego tome un promedio ponderado de los pronósticos obtenidos usando los datos hasta el año 5 y el pronóstico obtenido usando solo los datos del año 6, donde los pesos son iguales a y ( t - 4 ) / 36( 40 - t ) / 36 ( t - 4 ) / 36 respectivamente. Eso es muy ad hoc, y estoy seguro de que se puede hacer más objetivo al colocarlo en el contexto de un modelo estocástico más grande. Sin embargo, probablemente funcionará bien para sus propósitos.
fuente
Lo que pregunta es esencialmente lo que hace el modelado ARIMA de Box Jenkins (sus ciclos anuales se denominarían componentes estacionales). Además de buscar materiales por su cuenta, sugeriría
Análisis de series de tiempo aplicado para las ciencias sociales 1980 por R McCleary; RA Hay; EE Meidinger; D McDowall
Aunque puedo pensar en razones razonables de por qué desea pronosticar más en el futuro (y, por lo tanto, evaluar el error al hacerlo), a menudo es muy difícil en la práctica. Si tiene componentes estacionales muy fuertes, será más factible. De lo contrario, sus estimaciones probablemente alcanzarán un equilibrio en relativamente pocos períodos de tiempo futuros.
Si planea usar R para adaptarse a sus modelos, probablemente debería visitar el sitio web de Rob Hyndman (¡ojalá le dé mejores consejos que yo!)
fuente
tienes 5 años de datos y 40 observaciones por año. ¿Por qué no los publica en la web y nos permite responder esto en la zona cero en lugar de filosofar a 500 millas de altura? Espero los números. Hemos visto datos como este, por ejemplo, el número de clientes que intercambian su semana de tiempo compartido semanalmente. La serie comienza cada año en cero y se acumula a un valor límite.
fuente