autocorrelación espacial para datos de series temporales

11

Tengo un conjunto de datos de 20 años de un recuento anual de abundancia de especies para un conjunto de polígonos (~ 200 polígonos continuos de forma irregular). He estado utilizando análisis de regresión para inferir tendencias (cambio en el conteo por año) para cada polígono, así como agregaciones de datos de polígonos basados ​​en límites de gestión.

Estoy seguro de que existe una autocorrelación espacial en los datos, lo que seguramente afectará el análisis de regresión para los datos agregados. Mi pregunta es: ¿cómo ejecuto una prueba SAC para datos de series temporales? ¿Tengo que mirar el SAC de los residuos de mi regresión para cada año (Moran's I global)? ¿O puedo hacer una prueba con todos los años?

Una vez que he probado que sí, hay SAC, ¿hay alguna forma fácil de abordar esto? Mi fondo de estadísticas es mínimo y todo lo que he leído sobre modelado espacio-temporal suena muy complejo. Sé que R tiene una función de autocovariable ponderada por distancia. ¿Es esto fácil de usar?

Realmente estoy bastante confundido sobre cómo evaluar / abordar SAC para este problema y agradecería cualquier sugerencia, enlace o referencia. ¡Gracias por adelantado!

Rozza
fuente
1
¿Desea modelar procesos espaciales subyacentes, o desea ajustar su estimación de matriz de varianza-covarianza para tener en cuenta la autocorrelación espacial?
generic_user
1
O quieres hacer ambas cosas ...
gregmacfarlane
¡Gracias por tus respuestas! Creo que mis datos tienen una autodependencia espacial: es biológica y es muy probable que el recuento de especies en las unidades vecinas afecte a las unidades circundantes. Mis unidades son bastante grandes, por lo que tengo la intención de usar la opción 'conectar en bordes y esquinas' para establecer el retardo de distancia para probar SAC. Las funciones R para los modelos SAC parecen factibles (¡todavía sobre mi cabeza!). Gracias de nuevo.
Rozza
Bienvenido al sitio Rozza, esto debe dejarse como un comentario a una de las respuestas. Aunque asegúrese de votar las respuestas existentes si proporcionaron respuestas útiles, y marque una de ellas como respuesta a su pregunta si considera que se ha abordado satisfactoriamente.
Andy W

Respuestas:

5

Según este documento , OLS es consistente en presencia de autocorrelación espacial, pero los errores estándar son incorrectos y deben ser ajustados. Solomon Hsiang proporciona código stata y matlab para hacerlo. Lamentablemente, no estoy familiarizado con ningún código R para esto.

Ciertamente, existen otros enfoques para este tipo de problema en las estadísticas espaciales que modelan explícitamente los procesos espaciales. Este solo infla los errores estándar.

Desafortunadamente, a los econométricos teóricos les agrada ofuscarse. El artículo vinculado es realmente difícil de leer. Básicamente, lo que dice es ejecutar cualquier regresión que desee y luego corregir los errores estándar más adelante, es decir: usar el código de Hsiang. El espacio no entra hasta que tratas de estimar la varianza de tu estimador. Intuitivamente, si toda la diferencia está muy cerca, está menos seguro de que su estimación no sea solo una reliquia de un choque espacial no observado.

Tenga en cuenta que debe especificar un ancho de banda del núcleo sobre el que cree que podría estar funcionando el proceso espacial.

Esta respuesta es básicamente una repetición de copiar / pegar de una respuesta similar que hice aquí

genérico_usuario
fuente
5

Si el problema son errores autocorrelacionados, , entonces OLS es consistente pero ineficiente, como dice ACD. Es como la correlación serial en la econometría de series de tiempo.y=Xβ+u,u=ρWu+ϵ

Pero si hay una autodependencia espacial (también llamada autocorrelación, confusamente), , entonces OLS es inconsistente. Es lo mismo que un sesgo variable faltante. Si tiene ambos problemas, debe usar el modelo de Durbin espacial, .y = ρ W y + X β + W X λ + ϵy=ρWy+Xβ+ϵy=ρWy+Xβ+WXλ+ϵ

El paquete spdep para R contiene numerosas funciones que calculan matrices de ponderaciones espaciales, estiman regresiones espaciales y hacen otras cosas. Tengo mucha experiencia con las lagsarlmfunciones, pero vea en la documentación del paquete que hay una sacsarlmfunción que parece ser más de lo que está buscando.

En cuanto al aspecto temporal de su problema, las suposiciones que haga sobre la dependencia ayudarán en gran medida a determinar la especificación de su modelo. ¿Sus áreas interactúan entre sí directamente? Ejemplos de esto son los mercados comerciales o de vivienda; Las exportaciones de un país dependen en gran medida de las importaciones en otro, y el precio de venta de las casas compradas recientemente es una contribución muy importante al precio de venta de las casas cercanas. En este caso, tiene sentido especificar su matriz de pesos para acomodar esta dependencia. Permita que una casa comprada en el tiempo sea ​​"vecinos" con casas en el tiempo , pero no con casas en el tiempo .t t - 1 t + 1Wtt1t+1

Si sus términos están correlacionados pero no dependen lógicamente el uno del otro, como los rendimientos agrícolas, probablemente tendría más sentido tener una única matriz insensible al tiempo , pero incluir variables ficticias anuales en la especificaciónXWX

Gregmacfarlane
fuente
1
Buen post. Creo que la distinción que el OP debe tener en cuenta al elegir entre los dos enfoques es si el "resultado" en un polígono influirá en el resultado de sus vecinos. Si es así, vaya con el enfoque de gmacfarlane. Si no, el que propongo es más simple.
generic_user