Modelar una tendencia espacial por regresión con las coordenadas como predictores

9

Planeo incluir coordenadas como covariables en la ecuación de regresión para ajustar la tendencia espacial que existe en los datos. Después de eso, quiero probar los residuos en autocorrelación espacial en variación aleatoria. Tengo varias preguntas

  1. ¿Debo realizar la regresión lineal en el que sólo las variables independientes son y coordenadas y luego pruebas de residuos en la autocorrelación espacial, o debería más bien incluir no sólo las coordenadas como covariables, sino también otras variables y luego los residuos de prueba.xy

  2. Si espero tener una tendencia cuadrática, y luego incluir no solo , sino también, , e , pero algunos de ellos ( e ) tienen el valor más alto que el umbral - ¿Debo excluir aquellas variables con un valor más alto como no significativas? ¿Cómo debería interpretar la tendencia, ya no es cuadrática?x,yxyx2y2xyy2pp

  3. Supongo que debería tratar las coordenadas e como cualquier otra covariable, y probarlas para tener una relación lineal con la variable dependiente mediante la construcción de parcelas residuales parciales ... pero luego, una vez que las transforme (si muestran que necesitan transformación), eso no sea ​​ese tipo de tendencia más (especialmente si , e para la tendencia cuadrática). Puede mostrar que , por ejemplo, necesita transformación, mientras que no lo hace o no. ¿Cómo debo reaccionar en estas situaciones?xyxyx2y2x2x

Gracias.

Beka
fuente

Respuestas:

3

Creo que sería mejor ajustar un modelo lineal de efectos mixtos con efectos aleatorios espacialmente correlacionados (a veces llamado modelo geoestadístico ). Suponiendo que sus datos son gaussianos, especifique un modelo del formulario:

Yi=μi+Si+ϵi,

para observaciones , con representa los errores de iid y representando sus términos espaciales (donde ). La media podría ser una función de otras covariables (es decir, etc.) o podría ser simplemente una constante (podría ser mejor comenzar con este último por simplicidad).n1inϵN(0,τ2)SMVN(0,σ2R)S={S1,...,Sn}μiμi=β0+β1xi1+β2xi2

La matriz de correlación para los términos espaciales (que determina qué tan correlacionada cree que debería estar cada observación) puede especificarse mirando el variograma empírico. En general, la correlación entre las observaciones se elige solo para depender de la distancia entre ellas (aquí es donde sus coordenadas entran en el modelo).R

El Capítulo 2 de Geoestadística basada en modelos de Diggle y Ribeiro (2000) debería darle una introducción más detallada. El paquete R geoR tiene muchos procedimientos para ajustar modelos geoestadísticos, por lo que puede resultarle útil (consulte http://cran.r-project.org/web/packages/geoR/geoR.pdf ).

Sam Livingstone
fuente