Buscando cierto tipo de explicación ARIMA

25

Esto puede ser difícil de encontrar, pero me gustaría leer un ejemplo ARIMA bien explicado que

  • usa matemáticas mínimas

  • extiende la discusión más allá de construir un modelo para usar ese modelo para pronosticar casos específicos

  • utiliza gráficos y resultados numéricos para caracterizar el ajuste entre los valores pronosticados y los reales.

rolando2
fuente

Respuestas:

7

Mi lectura sugerida para una introducción al modelado ARIMA sería

Análisis de series de tiempo aplicadas para las ciencias sociales 1980 por R McCleary; RA Hay; EE Meidinger; D McDowall

Esto está dirigido a los científicos sociales para que las demandas matemáticas no sean demasiado rigurosas. También para tratamientos más cortos, sugeriría dos libros verdes de Sage (aunque son completamente redundantes con el libro de McCleary),

El texto de Ostrom es solo un modelo ARMA y no trata el pronóstico. No creo que cumplan con su requisito para graficar el error de pronóstico tampoco. Estoy seguro de que también podría obtener recursos más útiles al examinar las preguntas etiquetadas con series temporales en este foro.

Andy W
fuente
El libro de McCleary está maravillosamente escrito, conciso y es una muy buena introducción. También hay un maravilloso humor involuntario en el último capítulo donde hablan sobre lenguajes de alto nivel como Fortran.
richiemorrisroe
31

Trataré de responder a las gentiles instancias de Whuber de simplemente "responder a la pregunta" y mantener el tema. Recibimos 144 lecturas mensuales de una serie llamada "The Airline Series". Box y Jenkins fueron ampliamente criticados por proporcionar un pronóstico que estaba en la parte alta debido a la "naturaleza explosiva" de una transformación inversa.ingrese la descripción de la imagen aquí

Visualmente tenemos la impresión de que la varianza de la serie original aumenta con el nivel de la serie, lo que sugiere la necesidad de una transformación. Sin embargo, sabemos que uno de los requisitos para un modelo útil es que la varianza de los "errores del modelo" debe ser homogénea. No se necesitan suposiciones sobre la varianza de la serie original. Son idénticos si el modelo es simplemente una constante, es decir, y (t) = u. Como /stats//users/2392/probabilityislogic declaró tan claramente en su respuesta al Consejo sobre la explicación de la heterogeneidad / heterocedasticidad, "una cosa que siempre encuentro divertida es esta" no normalidad de los datos "que preocupa a la gente acerca de. No es necesario que los datos se distribuyan normalmente, pero el término de error sí "

Los primeros trabajos en series de tiempo a menudo llegaron a conclusiones erróneas sobre transformaciones injustificadas. Descubriremos aquí que la transformación correctiva para estos datos es simplemente agregar tres series ficticias de indicadores al modelo ARIMA que refleja un ajuste para tres puntos de datos inusuales. A continuación se muestra el gráfico de la función de autocorrelación que sugiere una fuerte autocorrelación en el retraso 12 (.76) y en el retraso 1 (.948). Las autocorrelaciones son simplemente coeficientes de regresión en un modelo donde y es la variable dependiente predicha por un retraso de y.

ingrese la descripción de la imagen aquí! ingrese la descripción de la imagen aquí

El análisis anterior sugiere que uno modele las primeras diferencias de la serie y estudie esa "serie residual" que es idéntica a las primeras diferencias primero por sus propiedades. ingrese la descripción de la imagen aquí

Este análisis confirma la idea de que existe un patrón estacional fuerte en los datos que podría ser remediado o modelado por un modelo que contuviera dos operadores de diferenciación.

ingrese la descripción de la imagen aquí ingrese la descripción de la imagen aquí

Esta simple doble diferenciación produce un conjunto de residuos, también conocido como una serie ajustada o, en términos generales, una serie transformada que evidencia una varianza no constante, pero la razón de la varianza no constante es la media no constante de los residuos. Aquí hay una gráfica de series doblemente diferenciadas, lo que sugiere tres anomalías al final de la serie. La autocorrelación de esta serie indica falsamente que "todo está bien" y que podría ser necesario un ajuste de Ma (1). Se debe tener cuidado ya que hay una sugerencia de anomalías en los datos, por lo que el acf está sesgado hacia abajo. Esto se conoce como el "Efecto de Alicia en el país de las maravillas", es decir, aceptar la hipótesis nula de ninguna estructura evidenciada cuando esa estructura está siendo enmascarada por una violación de uno de los supuestos.

ingrese la descripción de la imagen aquí ingrese la descripción de la imagen aquí

Detectamos visualmente tres puntos inusuales (117,135,136)

ingrese la descripción de la imagen aquí

Este paso de detectar los valores atípicos se llama Detección de intervención y puede programarse fácilmente, o no tan fácilmente, siguiendo el siguiente trabajo de Tsay.

ingrese la descripción de la imagen aquíingrese la descripción de la imagen aquí

Si agregamos tres indicadores al modelo, obtenemos ingrese la descripción de la imagen aquí

Entonces podemos estimar

ingrese la descripción de la imagen aquí

Y recibir una gráfica de los residuos y el acf

ingrese la descripción de la imagen aquí

ingrese la descripción de la imagen aquí

Este acf sugiere que agreguemos potencialmente dos coeficientes de promedio móvil al modelo. Por lo tanto, el próximo modelo estimado podría ser.

ingrese la descripción de la imagen aquí

Flexible

ingrese la descripción de la imagen aquí

ingrese la descripción de la imagen aquí

ingrese la descripción de la imagen aquí ingrese la descripción de la imagen aquí ingrese la descripción de la imagen aquí Luego se podría eliminar la constante no significativa y obtener un modelo refinado: ingrese la descripción de la imagen aquí

Notamos que no se necesitaron transformaciones de potencia para obtener un conjunto de residuos que varíen constantemente. Tenga en cuenta que los pronósticos no son explosivos.

ingrese la descripción de la imagen aquí

ingrese la descripción de la imagen aquí

En términos de una suma ponderada simple, tenemos: 13 pesos; 3 no cero e igual a (1.0.1,0., - 1.0)

ingrese la descripción de la imagen aquí

ingrese la descripción de la imagen aquí

Este material se presentó de manera no automática y, en consecuencia, requirió la interacción del usuario en términos de tomar decisiones de modelado.

IrishStat
fuente
Hola IrishStat, soy yo otra vez. Me encantó su extenso ejemplo, pero hay dos pasajes que son un poco oscuros (al menos para mí): "La autocorrelación de esta serie indica falsamente que" todo está bien "y podría ser necesario un ajuste de Ma (1) "y" Este acf sugiere que agreguemos potencialmente dos coeficientes de promedio móvil al modelo ". ¿Qué es exactamente lo que ves en esas tramas de ACF que te hace creer eso? ¿No se ven bien ambos (casi todos los valores están dentro de las "líneas azules")?
Bruder
: VBruder Creo que estaba "equivocado" con la afirmación "podría haber un ....." En el segundo ejemplo hay evidencia de "mal acf" en el rezago 1 y el rezago 12, lo que sugiere la necesidad potencial de los coeficientes t2o ma . Estás creyendo demasiado en estos límites, ya que boyh the acf91) y acf (12) están "peligrosamente cerca". Puede contactarme directamente a mi dirección de correo electrónico publicada disponible desde mi información.
IrishStat
Agradable escribir. "Modelo ARIMA que refleja un ajuste por tres puntos de datos inusuales" ¿Dice que agrega tres variables ficticias para estos tres puntos? En términos simples, ¿cómo se explican estos tres valores atípicos en futuras predicciones? (Estoy seguro de que es simple, simplemente no estoy familiarizado con él). Además, parece que sus límites de error no aumentan a medida que pasa el tiempo. (¿O tal vez el error vinculado depende de la modalidad del paso?) Gracias de antemano.
Adam
@ Adam, las tres variables ficticias no juegan ningún papel en el pronóstico, ya que los valores futuros son todos 0. Sí, los límites de error presentados son incorrectos. Hemos abordado esa falla y ahora AUTOBOX presenta límites de error cada vez mayores a medida que pasa el tiempo. Soy uno de los desarrolladores de AUTOBOX. .
IrishStat
@IrishStat "las tres variables ficticias no juegan ningún papel en el pronóstico ya que los valores futuros son todos 0." ¿Significa esto esencialmente que se extraen de los datos? ¿Deben tener algún impacto en los límites de predicción?
Adam
15

Traté de hacer eso en el capítulo 7 de mi libro de texto de 1998 con Makridakis y Wheelwright. Si tuve éxito o no, dejaré que otros juzguen. Puede leer algunos de los capítulos en línea a través de Amazon (desde p311). Busque "ARIMA" en el libro para convencer a Amazon de que le muestre las páginas relevantes.

Actualización: Tengo un nuevo libro que es gratuito y en línea. El capítulo ARIMA está aquí .

Rob Hyndman
fuente
3

Recomendaría Pronosticar con Caja Univariante - Modelos Jenkins: Conceptos y Casos por Alan Pankratz. Este libro clásico tiene todas las características que solicitó:

  • usa matemáticas mínimas
  • extiende la discusión más allá de construir un modelo para usar ese modelo para pronosticar casos específicos
  • utiliza gráficos y resultados numéricos para caracterizar el ajuste entre los valores pronosticados y los reales.

La única desventaja es que se imprimió en 1983 y podría no tener algunos desarrollos recientes. El editor llegará con una segunda edición en enero de 2014 con actualizaciones.

pronosticador
fuente
También recomendaría el otro libro de Alan Pankratz: Pronósticos con modelos de regresión dinámica. Material muy similar, pero cubre un poco más de terreno; aunque con menos detalles sobre el lado de Box-Jenkins. ¡Es bueno saber que habrá una segunda edición en enero de 2014!
Graeme Walsh el
-4

Un modelo ARIMA es simplemente un promedio ponderado. Responde la doble pregunta;

  1. ¿Cuántos períodos (k) debo usar para calcular un promedio ponderado

y

  1. Precisamente cuales son los k pesos

Responde a la oración de la doncella para determinar cómo ajustarse a los valores anteriores (y a los valores anteriores SOLO) para proyectar la serie (que realmente está siendo causada por variables causales no especificadas). Por lo tanto, un modelo ARIMA es un modelo causal de un hombre pobre.

IrishStat
fuente
-1 Esta respuesta no parece responder a la pregunta, que busca un "ejemplo bien explicado ... * *".
Whuber
@whuber: El OP solicitó una respuesta que "use matemática mínima". Mi respuesta detalló matemáticas mínimas y me motivó a explicar los modelos ARIMA en palabras comunes de todos los días. Esto nunca se hace como la teoría matemática chicos se centran en la "explicación de gama alta" por medio de los operadores de diferenciación, polinómicas, la optimización no lineal, etc.
IrishStat
@Irlandés Estoy de acuerdo con la motivación para mantener las matemáticas bajas, especialmente cuando lo solicite el usuario. Pero esta respuesta parece responder a una pregunta diferente: "qué es ARIMA". La naturaleza específica de la pregunta original también indica que el OP tiene una buena idea de qué es ARIMA y para qué sirve; Quieren verlo en acción. Apuesto a que podría contribuir fácilmente con un estudio de caso :-).
whuber
: whuber: Eso hubiera sido muy fácil para mí y podría hacer eso.
IrishStat
@Irlandés Espero verlo. Además, este problema no surgió aquí, pero ha surgido en otros lugares, tales contribuciones son potencialmente más poderosas y más apreciadas, formas de informar a las personas lo que puede hacer que muchas formas más abiertas de marketing.
whuber