Series temporales muy irregulares

10

Tengo datos para la población de varios peces diferentes, muestreados durante un período de aproximadamente 5 años, pero en un patrón muy irregular. A veces hay meses entre muestras, a veces hay varias muestras en un mes. También hay muchos 0 recuentos

¿Cómo lidiar con tales datos?

Puedo graficarlo con bastante facilidad en R, pero los gráficos no son particularmente esclarecedores, porque son muy desiguales.

En términos de modelado, con especies modeladas en función de varias cosas, tal vez un modelo mixto (también conocido como modelo multinivel).

Cualquier referencia o idea bienvenida

Algunos detalles en respuesta a los comentarios

Hay alrededor de 15 especies.

Estoy tratando de tener una idea de cualquier tendencia o estacionalidad en cada pez, y ver cómo se relacionan las especies entre sí (mi cliente originalmente quería una tabla simple de correlaciones)

El objetivo es descriptivo y analítico, no predictivo.

Ediciones adicionales: encontré este artículo de K. Rehfield et al., Que sugiere usar núcleos gaussianos para estimar el ACF para series temporales muy irregulares

http://www.nonlin-processes-geophys.net/18/389/2011/npg-18-389-2011.pdf

Peter Flom - Restablece a Monica
fuente
1
No soy el tipo adecuado para responder a su pregunta, pero un modelo multinivel parece razonable. ¿Alguna pista sobre qué tan grandes son las muestras, cuántas especies hay y cómo se produce el conteo cero? (En el último punto, ¿los intentos de las muestras son muestras aleatorias o están sesgadas, como si acabaras de obtener los conteos de un concurso de pesca de lubina que probablemente no arrojará ningún bagre?)
Wayne
1
"Tratar con" significa qué, exactamente? Para algunas ideas sobre cómo hacer frente a tiempos irregulares, busque este sitio en "+ tiempo + irregular"
whuber
¿Puedes aclarar el muestreo y el objetivo? Por ejemplo, ¿es esta captura-recaptura? ¿Es una red colocada en una corriente por un período de tiempo particular, sin lanzamiento? ¿Está tratando de estimar tamaños de muestra futuros o la población más grande de la cual se extrae una muestra? ¿Son las muestras de 1 o múltiples ubicaciones? No hay nada de malo en las series temporales irregulares, pero es un poco difícil entender la conexión entre los eventos de muestreo y entre las muestras y alguna variable objetivo (por ejemplo, una respuesta del modelo). Además, ¿el objetivo es de naturaleza predictiva o descriptiva?
Iterador
2
¿Por qué alguien votó esta pregunta? ¿Por qué no tratar de ayudar a desarrollar una mejor pregunta o respuesta?
Iterador
2
@Iterator Porque incluso ahora, después de "más ediciones", no hay una pregunta clara aquí. El voto negativo (entregado después de que no se observó respuesta a mi primer comentario) se colocó para alentar al OP a proporcionar las mejoras necesarias, así como una señal del único estado parcialmente formado de la pregunta tal como estaba. ¡No es el trabajo de todos los lectores (ni las modificaciones, para el caso) adivinar lo que se pretende!
whuber

Respuestas:

10

He pasado bastante tiempo creando un marco general para series de tiempo desigualmente espaciadas: http://www.eckner.com/research.html

Además, he escrito un artículo sobre la estimación de tendencias y estacionalidad para series de tiempo desigualmente espaciadas.

¡Espero que los resultados sean útiles!

Andreas Eckner
fuente
55
¡Gracias! Ese análisis fue hace mucho tiempo y ya no lo estoy haciendo, pero pueden aparecer cosas similares nuevamente; y otros buscan mucho en estos hilos, por lo que su comentario no se desperdicia.
Peter Flom - Restablece a Monica
Gracias por la información (y de hecho, años más tarde, alguien en Internet la está buscando), pero el enlace se ha apagado.
Enganchado el
2

No sé si un modelo mixto es muy apropiado (usando los paquetes estándar donde la estructura de efectos aleatorios es un predictor lineal), a menos que piense que los datos en todos los puntos de tiempo deberían ser intercambiables entre sí en algún sentido (en cuyo caso los intervalos irregulares no son un problema), realmente no estaría modelando la autocorrelación temporal de una manera razonable. Es posible que puedas engañar a lmer () para que haga algún tipo de autogressive, pero cómo exactamente lo harías eso se me escapa en este momento (puede que no esté pensando con claridad). Además, no estoy seguro de cuál sería la "variable de agrupación" que induce la autocorrelación en el escenario de modelo mixto.

Si la autocorrelación temporal es un parámetro molesto y no espera que sea demasiadogrande, entonces podría agrupar los datos en épocas que son esencialmente disjuntas entre sí en términos de correlación (por ejemplo, separar las series de tiempo en los puntos donde hay meses sin datos) y verlas como réplicas independientes. Luego, podría hacer algo así como un GEE en este conjunto de datos modificado donde el "clúster" está definido por la época en la que se encuentra, y las entradas de la matriz de correlación de trabajo son una función de cuán separadas se hicieron las observaciones. Si su función de regresión es correcta, aún obtendrá estimaciones consistentes de los coeficientes de regresión, incluso si la estructura de correlación está mal especificada. Esto también le permitiría modelarlo como datos de recuento utilizando, por ejemplo, el enlace de registro (como se haría normalmente en la regresión de Poisson). También podría construir alguna correlación diferencial entre especies, donde cada punto de tiempo es visto como un vector multivariado de especies cuenta con alguna asociación de descomposición temporal entre puntos de tiempo. Esto requeriría un cierto procesamiento previo para engañar a los paquetes estándar de GEE para que lo hagan.

Ys,Ytu,v

cov(Ys,Yt)=fθ(s,t,u,v)

fθ

Macro
fuente
Gracias @macro. Yo creo que un modelo mixto podría estar bien, porque a menudo se utilizan para los datos que se anida en el tiempo; No estoy tan interesado en modelar la autocorrelación, es decir, es una molestia. Estoy de acuerdo en que el tiempo no será lineal, pero puedo agregar efectos del tiempo (aún no estoy seguro de cuáles, pero puedo explorarlo). No tengo MPLUS, pero tengo R y SAS.
Peter Flom - Restablece a Monica
1
Solo digo que un modelo mixto estándar podría no ser apropiado en esta situación. La intercepción aleatoria es inútil si no cree que los puntos de tiempo sean intercambiables en términos de correlación (es decir, solo ofrecería una aproximación dentro del mundo de 'correlación intercambiable' a su verdadera estructura de correlación). La inclusión de pendientes aleatorias en el tiempo indica que cree que la trayectoria se está "dirigiendo a alguna parte" con el tiempo, ya que la trama no fue muy esclarecedora para usted, esto probablemente no esté sucediendo. Sin embargo, debo admitir que puedes engañar a lmer () para que haga algo más apropiado.
Macro
2
+1 Una respuesta buena y concisa que aborda todos los puntos principales que pensé abordar y más. Con respecto a los paquetes en R, una búsqueda en Google de CRAN, para [poisson regression temporal], arroja varios paquetes. El surveillancepaquete puede tener la funcionalidad deseada. Este tipo de modelado no es infrecuente en los estudios ecológicos, por lo que probablemente sea mejor encontrar un buen paquete en los rincones ecológicos de CRAN.
Iterator