Esta es una pregunta un poco frívola, pero tengo un gran interés en la respuesta. Trabajo en un hospital psiquiátrico y tengo datos de tres años, recopilados todos los días en cada sala sobre el nivel de violencia en esa sala.
Claramente, el modelo que se ajusta a estos datos es un modelo de serie temporal. Tuve que diferenciar los puntajes para hacerlos más normales. Encajé un modelo ARMA con los datos diferenciados, y creo que el mejor ajuste fue un modelo con un grado de diferenciación y autocorrelación de primer orden en el rezago 2.
Mi pregunta es, ¿para qué demonios puedo usar este modelo? Las series de tiempo siempre parecen tan útiles en los libros de texto cuando se trata de poblaciones de liebres y precios del petróleo, pero ahora que he hecho el mío, el resultado parece tan abstracto que es completamente opaco. Los puntajes diferenciados se correlacionan entre sí en el rezago dos, pero realmente no puedo aconsejar a todos que estén en alerta máxima dos días después de un incidente grave con toda seriedad.
O puedo?
fuente
Respuestas:
El modelo que se ajusta a los datos no tiene que ser un modelo de serie temporal; Aconsejaría pensar un poco fuera de la caja.
Si tiene múltiples variables (por ejemplo, edad, sexo, dieta, origen étnico, enfermedad, medicamentos) puede usarlas para un modelo diferente. ¿Quizás tener ciertos pacientes en la misma habitación es un predictor importante? ¿O tal vez tiene que ver con el personal que lo atiende? O considere usar un modelo de series de tiempo de múltiples variantes (por ejemplo, VECM) si tiene otras variables que puede usar. Mire las relaciones entre la violencia entre pacientes: ¿ciertos pacientes actúan juntos?
El modelo de serie temporal es útil si el tiempo tiene un papel importante en el comportamiento. Por ejemplo, puede haber una agrupación de violencia. Mire la literatura de agrupamiento de volatilidad. Como sugiere @Jonas, con un orden de retraso de 2, es posible que deba estar más alerta el día después de un estallido de violencia. Pero eso no le ayuda a prevenir el primer día: puede haber otra información que pueda vincular al análisis para comprender realmente la causa de la violencia, en lugar de simplemente emitirla en una serie de series de tiempo.
Por último, como sugerencia técnica: si está utilizando R para el análisis, puede echar un vistazo al paquete de pronóstico de Rob Hyndman (el creador de este sitio). Esto tiene muchas características muy bonitas; vea el documento "Predicción automática de series temporales: el paquete de pronóstico para R" en el Journal of Statistical Software.
fuente
Ajustó el modelo a las diferencias, lo que significa que está describiendo el cambio en los niveles de violencia. Tienes un retraso de 2 días. Un retraso es indicativo de la memoria del proceso. En otras palabras, el cambio en los niveles de violencia de hoy depende en cierta medida del cambio en los niveles de violencia en los últimos dos días. Para escalas de tiempo más largas, la contribución de influencias aleatorias se vuelve lo suficientemente fuerte como para que ya no haya un vínculo claro.
¿Es positiva la autocorrelación? Entonces, un cambio en los niveles de violencia hoy sugiere un cambio similar en los niveles de violencia en dos días. Es negativo? Entonces la violencia podría permanecer más alta por dos días.
Por supuesto, es posible que desee controlar los efectos de confusión. Por ejemplo, después de un incidente grave, es más probable que las personas denuncien incidentes menores, pero esta "sensibilización" desaparecería después de dos días.
fuente