Cuándo iniciar sesión transformar una serie temporal antes de ajustar un modelo ARIMA

26

Anteriormente utilicé Forecast Pro para pronosticar series de tiempo univariantes, pero estoy cambiando mi flujo de trabajo a R. El paquete de pronósticos para R contiene muchas funciones útiles, pero una cosa que no hace es ningún tipo de transformación de datos antes de ejecutar Auto .arima (). En algunos casos, Forecast Pro decide registrar datos de transformación antes de hacer pronósticos, pero aún no he descubierto por qué.

Entonces mi pregunta es: ¿cuándo debo transformar mi serie de tiempo antes de probar los métodos ARIMA en ella?

/ edit: después de leer sus respuestas, voy a usar algo como esto, donde x es mi serie temporal:

library(lmtest)
if ((gqtest(x~1)$p.value < 0.10) {
    x<-log(x)
}

¿Esto tiene sentido?

r time-series data-transformation forecasting arima Zach
fuente

21

Algunas advertencias antes de proceder. Como a menudo sugiero a mis alumnos, use las auto.arima()cosas solo como una primera aproximación a su resultado final o si desea tener un modelo parsimonioso cuando verifica que su modelo rival basado en la teoría funcione mejor.

Datos

Claramente, debe comenzar con la descripción de los datos de series temporales con los que está trabajando. En macroeconometría, generalmente trabajas con datos agregados, y los medios geométricos (sorprendentemente) tienen más evidencia empírica para datos de series de tiempo macro, probablemente porque la mayoría de ellos se descomponen en una tendencia de crecimiento exponencial .

Por cierto, la sugerencia de Rob "visualmente" funciona para series de tiempo con una parte estacional clara , ya que los datos anuales que varían lentamente son menos claros para los aumentos en la variación. Afortunadamente, generalmente se observa una tendencia de crecimiento exponencial (si parece ser lineal, entonces no hay necesidad de registros).

Modelo

Si su análisis se basa en alguna teoría que establece que alguna media geométrica ponderada más conocida como la El modelo de regresión multiplicativa es con el que tienes que trabajar. Luego, generalmente, se pasa a un modelo de regresión log-log , que es lineal en los parámetros y la mayoría de sus variables, pero algunas tasas de crecimiento, se transforman. $Y(t) = X_1^{\alpha_1}(t)...X_k^{\alpha_k}(t)\varepsilon(t)$

En la econometría financiera, los registros son algo común debido a la popularidad de los retornos de registros, porque ...

Las transformaciones de registro tienen buenas propiedades

En el modelo de regresión log-log es la interpretación del parámetro estimado, digamos como la elasticidad de en . $\alpha_i$ $Y(t)$ $X_i(t)$

En los modelos de corrección de errores tenemos una suposición empíricamente más fuerte de que las proporciones son más estables ( estacionarias ) que las diferencias absolutas.

En la econometría financiera, es fácil agregar los retornos logarítmicos con el tiempo .

Hay muchas otras razones no mencionadas aquí.

Finalmente

Tenga en cuenta que la transformación logarítmica generalmente se aplica a variables no negativas (nivel). Si observa las diferencias de dos series de tiempo (exportación neta, por ejemplo), ni siquiera es posible tomar el registro, debe buscar los datos originales en niveles o asumir la forma de tendencia común que se resta.

[ adición después de editar ] Si aún desea un criterio estadístico sobre cuándo realizar la transformación logarítmica, una solución simple sería cualquier prueba de heterocedasticidad. En el caso de una variación creciente, recomendaría Goldfeld-Quandt Test o similar. En R se encuentra en library(lmtest)y se denota por la gqtest(y~1)función. Simplemente retroceder en el término de intercepción si no tiene ningún modelo de regresión, yes su variable dependiente.

Dmitrij Celov
fuente

Gracias por la info. Con la prueba GQ, cuanto menor es el valor de p, ¿es más probable que la distribución sea heteroscedastica?

Zach

@Zach: exactamente, tome el 5% por ejemplo, por supuesto si no planea ir a la minería de datos. Yo personalmente comienzo a partir de los supuestos del modelo.

Dmitrij Celov

@Dmitrij. Gracias. Solo quiero asegurarme de que estoy interpretando la salida correctamente.

Zach

29

Trace una gráfica de los datos contra el tiempo. Si parece que la variación aumenta con el nivel de la serie, tome registros. De lo contrario, modele los datos originales.

Rob Hyndman
fuente

3

Aquí hay una pregunta: ¿cuál es el efecto si tomas registros y no son necesarios? Me ha gustado trabajar con series de tiempo que requieren una transformación logarítmica, porque (según tengo entendido) los coeficientes son proporciones y, en valores pequeños, casi porcentajes. (Por ejemplo, exp (0.05) = 1.051.)

Wayne

4

Por sus frutos los conoceréis

El supuesto (para ser probado) es que los errores del modelo tienen una varianza constante. Tenga en cuenta que esto no significa los errores de un modelo asumido. Cuando usa un análisis gráfico simple, esencialmente está asumiendo un modelo lineal en el tiempo.

Por lo tanto, si tiene un modelo inadecuado, como podría sugerir un gráfico informal de los datos en función del tiempo, puede concluir incorrectamente sobre la necesidad de una transformación de potencia. Box y Jenkins lo hicieron con su ejemplo Airline Data. No tuvieron en cuenta 3 valores inusuales en los datos más recientes, por lo tanto, concluyeron incorrectamente que había una mayor variación en los residuos en el nivel más alto de la serie.

Para obtener más información sobre este tema, visite http://www.autobox.com/pdfs/vegas_ibf_09a.pdf

IrishStat
fuente

1

Es posible que desee registrar series de transformación cuando son de alguna manera geométricas de forma natural o cuando el valor temporal de una inversión implica que se comparará con un bono de riesgo mínimo que tiene un rendimiento positivo. Esto los hará más "linealizables" y, por lo tanto, adecuados para una relación de recurrencia de diferenciación simple.

DWin
fuente

1

Las transformaciones son como las drogas: algunas son buenas para usted y otras no. Si no está interesado en probar hipótesis estadísticas, puede asumir lo que quiera. Las pruebas de hipótesis paramétricas tienen supuestos sobre el precio del error, ignórelos bajo su propio riesgo.

IrishStat el

1

Tan verdadero. Dije que el proceso debía ser geométrico. Si no se transforma, también pueden producirse errores en la inferencia. No veo dónde estaba sugiriendo ignorar los supuestos sobre las condiciones de inferencia válida.

DWin

1

stats.stackexchange.com/questions/6498/… incluyó una discusión sobre cuándo y por qué transformar. El "hecho" de que el derivado original es "geométrico" no infiere que los residuos de un modelo adecuado tengan una desviación estándar que sea proporcional a la media. Podría PERO tiene que ser empíricamente probado o al menos probado.

IrishStat el

Cuándo iniciar sesión transformar una serie temporal antes de ajustar un modelo ARIMA

Respuestas: