Tengo datos para la población de varios peces diferentes, muestreados durante un período de aproximadamente 5 años, pero en un patrón muy irregular. A veces hay meses entre muestras, a veces hay varias muestras en un mes. También hay muchos 0 recuentos
¿Cómo lidiar con tales datos?
Puedo graficarlo con bastante facilidad en R, pero los gráficos no son particularmente esclarecedores, porque son muy desiguales.
En términos de modelado, con especies modeladas en función de varias cosas, tal vez un modelo mixto (también conocido como modelo multinivel).
Cualquier referencia o idea bienvenida
Algunos detalles en respuesta a los comentarios
Hay alrededor de 15 especies.
Estoy tratando de tener una idea de cualquier tendencia o estacionalidad en cada pez, y ver cómo se relacionan las especies entre sí (mi cliente originalmente quería una tabla simple de correlaciones)
El objetivo es descriptivo y analítico, no predictivo.
Ediciones adicionales: encontré este artículo de K. Rehfield et al., Que sugiere usar núcleos gaussianos para estimar el ACF para series temporales muy irregulares
http://www.nonlin-processes-geophys.net/18/389/2011/npg-18-389-2011.pdf
fuente
Respuestas:
He pasado bastante tiempo creando un marco general para series de tiempo desigualmente espaciadas: http://www.eckner.com/research.html
Además, he escrito un artículo sobre la estimación de tendencias y estacionalidad para series de tiempo desigualmente espaciadas.
¡Espero que los resultados sean útiles!
fuente
No sé si un modelo mixto es muy apropiado (usando los paquetes estándar donde la estructura de efectos aleatorios es un predictor lineal), a menos que piense que los datos en todos los puntos de tiempo deberían ser intercambiables entre sí en algún sentido (en cuyo caso los intervalos irregulares no son un problema), realmente no estaría modelando la autocorrelación temporal de una manera razonable. Es posible que puedas engañar a lmer () para que haga algún tipo de autogressive, pero cómo exactamente lo harías eso se me escapa en este momento (puede que no esté pensando con claridad). Además, no estoy seguro de cuál sería la "variable de agrupación" que induce la autocorrelación en el escenario de modelo mixto.
Si la autocorrelación temporal es un parámetro molesto y no espera que sea demasiadogrande, entonces podría agrupar los datos en épocas que son esencialmente disjuntas entre sí en términos de correlación (por ejemplo, separar las series de tiempo en los puntos donde hay meses sin datos) y verlas como réplicas independientes. Luego, podría hacer algo así como un GEE en este conjunto de datos modificado donde el "clúster" está definido por la época en la que se encuentra, y las entradas de la matriz de correlación de trabajo son una función de cuán separadas se hicieron las observaciones. Si su función de regresión es correcta, aún obtendrá estimaciones consistentes de los coeficientes de regresión, incluso si la estructura de correlación está mal especificada. Esto también le permitiría modelarlo como datos de recuento utilizando, por ejemplo, el enlace de registro (como se haría normalmente en la regresión de Poisson). También podría construir alguna correlación diferencial entre especies, donde cada punto de tiempo es visto como un vector multivariado de especies cuenta con alguna asociación de descomposición temporal entre puntos de tiempo. Esto requeriría un cierto procesamiento previo para engañar a los paquetes estándar de GEE para que lo hagan.
fuente
surveillance
paquete puede tener la funcionalidad deseada. Este tipo de modelado no es infrecuente en los estudios ecológicos, por lo que probablemente sea mejor encontrar un buen paquete en los rincones ecológicos de CRAN.