análisis espacial y espacio-temporal

8

Tengo un conjunto de datos que consta de 247 trampas para mosquitos colocadas en posiciones fijas y muestreadas semanalmente durante 23 semanas. También tengo datos de incidencia de la enfermedad del dengue (indexados a la dirección del hogar) durante el mismo período de tiempo. Me gustaría ver si existe una correlación espacial y espacio-temporal entre la tasa de captura de mosquitos en cada ubicación de trampa y la incidencia de casos de dengue. Ya he probado la permutación de espacio-tiempo multivariante I y R de Moran global I y Moran local I en R y SaTScan. Ninguno de estos parece darme lo que quiero. ¿Estoy mirando el lugar correcto y simplemente lo estoy haciendo mal o hay mejores análisis que puedo ejecutar?

¡¡Muchas gracias por el consejo!! Lo mejor, Amy Green

Amy Green
fuente
"Ninguno de estos parece darme lo que quiero". ¿Y qué te gustaría lograr exactamente?
radek
1
La regresión ponderada geográficamente podría ser el camino a seguir. Puede ejecutar ejecutar por período temporal y comparar los residuos. Lógicamente, las entradas serían el volumen de insectos atrapados como un predictor de enfermedad como punto de partida ... aunque, dependiendo de la distribución de las trampas, es posible que también desee considerar los entornos ambientales
Andrew Tice
1
@Andrew Tice No tiene la intención de ser sarcástico pero, por curiosidad, ¿por qué saltaría a un GWR sin indicación de no estacionariedad, o incluso autocorrelación, en los datos? Este es un enfoque algo dudoso que solo es apropiado en situaciones muy específicas y solo debe usarse realmente en un contexto exploratorio o experimental.
Jeffrey Evans
@JeffreyEvans ... buen punto ... y con el beneficio de dos años en retrospectiva, ¡no lo haría!
Andrew Tice

Respuestas:

2

Supongo que estás tratando de estimar la efectividad de las trampas para reducir la incidencia de contracción del dengue. Es posible que desee echar un vistazo a las pruebas de interacción espacio-tiempo.

PySAL tiene varias implementaciones en su módulo spatial_dynamics.

pastephens
fuente
1

¿Son los datos de mosquitos, cuenta? o qué tipo de variables estás recordando en estas trampas? He visto un estudio en el que usan MaxEnt para predecir la leishmania en México durante los próximos 20 años más o menos utilizando solo la presencia de las ubicaciones de la enfermedad como datos. No creo que sea muy confiable, pero es un punto de partida y ha habido muchos desarrollos. ¿Qué está "buscando"? Una especie de kriging le permitiría comprender la variabilidad espacial de sus variables. Incluso podría ejecutar algunas simulaciones si obtiene modelos que se ajustan bien. Estoy bastante seguro de que hay técnicas de kriging que funcionan en un contexto de tiempo espacial, pero nunca las he usado. Una búsqueda rápida en Google debería arrojar algunas referencias. 23 semanas no son muchos puntos de datos para el análisis de series de tiempo, pero podría probarlo, El paquete R bfast le permite detectar interrupciones abruptas en el comportamiento de una serie de tiempo, tal vez pueda detectar estas anomalías y asociarlas a brotes de dengue. Creo que necesita producir una mejor descripción de su problema y los resultados deseados del estudio.

JEquihua
fuente
1

Es difícil de decir sin ver sus datos y trabajar a través de un análisis exploratorio. Serían bienvenidos algunos detalles más sobre hipótesis, diseño de muestra y datos reales recopilados. Al hacer preguntas de metodología estadística, es importante que establezca la hipótesis que está probando. Esto puede dictar la metodología estadística y, sin saberlo, estamos disparando en la oscuridad.

Tampoco está claro cuál es el problema con las estadísticas especificadas en relación con "no darme lo que quiero". No sé qué esperaba con una estadística de autocorrelación univariada que indica una correlación espacial bivariada. La familia de estadísticas de SCAN es bastante variable con muchas distribuciones definidas disponibles. ¿Qué distribución (modelo) definió en SaTScan y realmente tiene una hipótesis y datos adecuados para un análisis de patrón de puntos? En general, una muestra cuadriculada y sistemática no es apropiada para un análisis de patrón de puntos.

Una correlación sería muy limitante desde un punto de vista inferencial y parecería que un modo de tipo de regresión está en orden aquí. A primera vista, pensaría que un modelo de efectos mixtos con un término AR-I para el tiempo y un término de autocorrelación para los efectos aleatorios espaciales satisfaría sus necesidades. Esto le permitiría dividir la variación por tiempo y normalizar cualquier influencia que la autocorrelación tenga sobre el error residual y las suposiciones iid. Otra opción, si los datos lo admitieran, sería un modelo de proceso de punto de Poisson en un marco MCMC. Si se especifica como un modelo jerárquico, puede definir el tiempo como previo. Con un enfoque de regresión de kernel, podría probar múltiples hipótesis de procesos de difusión espacial o definir un término de difusión cuadrática. Este tipo de modelo se usa comúnmente en epidemiología espacial para obtener una tasa de diseminación.

Es fácil perderse al "arrojar sus datos contra la pared" con enfoques estadísticos espaciales, pero, a menos que su diseño de muestra pretendiera capturar el proceso espacial y tenga una pregunta bien formulada sobre el efecto espacial, este puede ser un ejercicio inútil.

Debido a la fácil disponibilidad de metodologías, los métodos frecuentistas a menudo se pasan por alto. Hay modelos de regresión disponibles que pueden tratar fácilmente con datos espaciales (autorregresivo espacial y condicional, regresión espacial, regresión polinómica, modelos de efectos mixtos, regresión canónica, regresión de kernel, regresiones semi y no paramétricas, ...) y si tiene la intención de inferencia estos deben ser explorados en relación con su hipótesis.

Jeffrey Evans
fuente