Algunas advertencias antes de proceder. Como a menudo sugiero a mis alumnos, use las auto.arima()
cosas solo como una primera aproximación a su resultado final o si desea tener un modelo parsimonioso cuando verifica que su modelo rival basado en la teoría funcione mejor.
Datos
Claramente, debe comenzar con la descripción de los datos de series temporales con los que está trabajando. En macroeconometría, generalmente trabajas con datos agregados, y los medios geométricos (sorprendentemente) tienen más evidencia empírica para datos de series de tiempo macro, probablemente porque la mayoría de ellos se descomponen en una tendencia de crecimiento exponencial .
Por cierto, la sugerencia de Rob "visualmente" funciona para series de tiempo con una parte estacional clara , ya que los datos anuales que varían lentamente son menos claros para los aumentos en la variación. Afortunadamente, generalmente se observa una tendencia de crecimiento exponencial (si parece ser lineal, entonces no hay necesidad de registros).
Modelo
Si su análisis se basa en alguna teoría que establece que alguna media geométrica ponderada más conocida como la El modelo de regresión multiplicativa es con el que tienes que trabajar. Luego, generalmente, se pasa a un modelo de regresión log-log , que es lineal en los parámetros y la mayoría de sus variables, pero algunas tasas de crecimiento, se transforman.Y( t ) = Xα11( T ) . . . Xαkk( t ) ε ( t )
En la econometría financiera, los registros son algo común debido a la popularidad de los retornos de registros, porque ...
Las transformaciones de registro tienen buenas propiedades
En el modelo de regresión log-log es la interpretación del parámetro estimado, digamos como la elasticidad de en .αyoY( t )Xyo( t )
En los modelos de corrección de errores tenemos una suposición empíricamente más fuerte de que las proporciones son más estables ( estacionarias ) que las diferencias absolutas.
En la econometría financiera, es fácil agregar los retornos logarítmicos con el tiempo .
Hay muchas otras razones no mencionadas aquí.
Finalmente
Tenga en cuenta que la transformación logarítmica generalmente se aplica a variables no negativas (nivel). Si observa las diferencias de dos series de tiempo (exportación neta, por ejemplo), ni siquiera es posible tomar el registro, debe buscar los datos originales en niveles o asumir la forma de tendencia común que se resta.
[ adición después de editar ] Si aún desea un criterio estadístico sobre cuándo realizar la transformación logarítmica, una solución simple sería cualquier prueba de heterocedasticidad. En el caso de una variación creciente, recomendaría Goldfeld-Quandt Test o similar. En R se encuentra en library(lmtest)
y se denota por la gqtest(y~1)
función. Simplemente retroceder en el término de intercepción si no tiene ningún modelo de regresión, y
es su variable dependiente.
Trace una gráfica de los datos contra el tiempo. Si parece que la variación aumenta con el nivel de la serie, tome registros. De lo contrario, modele los datos originales.
fuente
Por sus frutos los conoceréis
El supuesto (para ser probado) es que los errores del modelo tienen una varianza constante. Tenga en cuenta que esto no significa los errores de un modelo asumido. Cuando usa un análisis gráfico simple, esencialmente está asumiendo un modelo lineal en el tiempo.
Por lo tanto, si tiene un modelo inadecuado, como podría sugerir un gráfico informal de los datos en función del tiempo, puede concluir incorrectamente sobre la necesidad de una transformación de potencia. Box y Jenkins lo hicieron con su ejemplo Airline Data. No tuvieron en cuenta 3 valores inusuales en los datos más recientes, por lo tanto, concluyeron incorrectamente que había una mayor variación en los residuos en el nivel más alto de la serie.
Para obtener más información sobre este tema, visite http://www.autobox.com/pdfs/vegas_ibf_09a.pdf
fuente
Es posible que desee registrar series de transformación cuando son de alguna manera geométricas de forma natural o cuando el valor temporal de una inversión implica que se comparará con un bono de riesgo mínimo que tiene un rendimiento positivo. Esto los hará más "linealizables" y, por lo tanto, adecuados para una relación de recurrencia de diferenciación simple.
fuente