Usar análisis de series temporales para analizar / predecir comportamientos violentos

13

Esta es una pregunta un poco frívola, pero tengo un gran interés en la respuesta. Trabajo en un hospital psiquiátrico y tengo datos de tres años, recopilados todos los días en cada sala sobre el nivel de violencia en esa sala.

Claramente, el modelo que se ajusta a estos datos es un modelo de serie temporal. Tuve que diferenciar los puntajes para hacerlos más normales. Encajé un modelo ARMA con los datos diferenciados, y creo que el mejor ajuste fue un modelo con un grado de diferenciación y autocorrelación de primer orden en el rezago 2.

Mi pregunta es, ¿para qué demonios puedo usar este modelo? Las series de tiempo siempre parecen tan útiles en los libros de texto cuando se trata de poblaciones de liebres y precios del petróleo, pero ahora que he hecho el mío, el resultado parece tan abstracto que es completamente opaco. Los puntajes diferenciados se correlacionan entre sí en el rezago dos, pero realmente no puedo aconsejar a todos que estén en alerta máxima dos días después de un incidente grave con toda seriedad.

O puedo?

Chris Beeley
fuente
¿podría editar el título a algo como "Usar análisis de series temporales para analizar / predecir comportamientos violentos"?
Paul
1
Realmente me gusta este tipo de pregunta, creo que este tipo de problema preciso de trabajo real aumentará el interés del sitio. Sería aún mejor si tuviera la posibilidad de agregar un enlace a los datos, o decirnos (como complemento de la publicación) lo que finalmente hizo, cuáles fueron las conclusiones ... sin embargo, entiendo que esto puede ser confidencial ...
robin girard
Quisiera poder votar de nuevo para hacerte pasar por alto la pregunta sobre la definición de una variable aleatoria;)
robin girard
Volveré para contarte cuáles fueron los resultados, pero pasará un tiempo mientras trabajo en mi camino junto con muchas otras tareas. ¿No estaba seguro de lo que quería decir con "pasar por alto la pregunta sobre la variable aleatoria"? ¿Hay alguna pregunta que me recomienden que mire?
Chris Beeley
perdón si no estaba claro, quiero decir que prefiero preguntas (opinión subjetiva personal) como la suya que la pregunta que pregunta "qué es una variable aleatoria" ... pero supongo que mi placer no es el de todos :)
robin girard

Respuestas:

9

El modelo que se ajusta a los datos no tiene que ser un modelo de serie temporal; Aconsejaría pensar un poco fuera de la caja.

Si tiene múltiples variables (por ejemplo, edad, sexo, dieta, origen étnico, enfermedad, medicamentos) puede usarlas para un modelo diferente. ¿Quizás tener ciertos pacientes en la misma habitación es un predictor importante? ¿O tal vez tiene que ver con el personal que lo atiende? O considere usar un modelo de series de tiempo de múltiples variantes (por ejemplo, VECM) si tiene otras variables que puede usar. Mire las relaciones entre la violencia entre pacientes: ¿ciertos pacientes actúan juntos?

El modelo de serie temporal es útil si el tiempo tiene un papel importante en el comportamiento. Por ejemplo, puede haber una agrupación de violencia. Mire la literatura de agrupamiento de volatilidad. Como sugiere @Jonas, con un orden de retraso de 2, es posible que deba estar más alerta el día después de un estallido de violencia. Pero eso no le ayuda a prevenir el primer día: puede haber otra información que pueda vincular al análisis para comprender realmente la causa de la violencia, en lugar de simplemente emitirla en una serie de series de tiempo.

Por último, como sugerencia técnica: si está utilizando R para el análisis, puede echar un vistazo al paquete de pronóstico de Rob Hyndman (el creador de este sitio). Esto tiene muchas características muy bonitas; vea el documento "Predicción automática de series temporales: el paquete de pronóstico para R" en el Journal of Statistical Software.

Shane
fuente
1
De acuerdo, solo para arrojar algunas ideas adicionales sobre modelado: logística para predecir qué pacientes tendrán más de 1 arrebatos violentos, regresión de Poisson (esque) para predecir qué pacientes tendrán muchos arrebatos, niveles múltiples para examinar las variaciones de una habitación a otra y / o sala a sala ...
Matt Parker
1
+1 Es fácil quedar cegado por las exhortaciones de no usar modelos lineales, etc., en series temporales debido a problemas de autocorrelación, y quedar atrapado en ARIMA, DLM, etc., cuando LM, GLM, etc. pueden ser bastante poderosos con Un poco de precaución.
Wayne
6

Ajustó el modelo a las diferencias, lo que significa que está describiendo el cambio en los niveles de violencia. Tienes un retraso de 2 días. Un retraso es indicativo de la memoria del proceso. En otras palabras, el cambio en los niveles de violencia de hoy depende en cierta medida del cambio en los niveles de violencia en los últimos dos días. Para escalas de tiempo más largas, la contribución de influencias aleatorias se vuelve lo suficientemente fuerte como para que ya no haya un vínculo claro.

¿Es positiva la autocorrelación? Entonces, un cambio en los niveles de violencia hoy sugiere un cambio similar en los niveles de violencia en dos días. Es negativo? Entonces la violencia podría permanecer más alta por dos días.

Por supuesto, es posible que desee controlar los efectos de confusión. Por ejemplo, después de un incidente grave, es más probable que las personas denuncien incidentes menores, pero esta "sensibilización" desaparecería después de dos días.

Jonas
fuente