Antecedentes
Tengo datos de un estudio de campo en el que hay cuatro niveles de tratamiento y seis réplicas en cada uno de los dos bloques. (4x6x2 = 48 observaciones)
Los bloques están separados aproximadamente 1 milla, y dentro de los bloques, hay una cuadrícula de 42 parcelas de 2m x 4m y una pasarela de 1m de ancho; mi estudio solo usó 24 parcelas en cada bloque.
Me gustaría evaluar evaluar la covarianza espacial.
Aquí hay un análisis de ejemplo que utiliza los datos de un solo bloque, sin tener en cuenta la covarianza espacial. En el conjunto de datos, plot
es la identificación del gráfico, x
es la ubicación xy la ubicación y y
de cada gráfico con el gráfico 1 centrado en 0, 0. level
es el nivel de tratamiento y response
es la variable de respuesta.
layout <- structure(list(plot = c(1L, 3L, 5L, 7L, 8L, 11L, 12L, 15L, 16L,
17L, 18L, 22L, 23L, 26L, 28L, 30L, 31L, 32L, 35L, 36L, 37L, 39L,
40L, 42L), level = c(0L, 10L, 1L, 4L, 10L, 0L, 4L, 10L, 0L, 4L,
0L, 1L, 0L, 10L, 1L, 10L, 4L, 4L, 1L, 1L, 1L, 0L, 10L, 4L), response = c(5.93,
5.16, 5.42, 5.11, 5.46, 5.44, 5.78, 5.44, 5.15, 5.16, 5.17, 5.82,
5.75, 4.48, 5.25, 5.49, 4.74, 4.09, 5.93, 5.91, 5.15, 4.5, 4.82,
5.84), x = c(0, 0, 0, 3, 3, 3, 3, 6, 6, 6, 6, 9, 9, 12, 12, 12,
15, 15, 15, 15, 18, 18, 18, 18), y = c(0, 10, 20, 0, 5, 20, 25,
10, 15, 20, 25, 15, 20, 0, 15, 25, 0, 5, 20, 25, 0, 10, 20,
25)), .Names = c("plot", "level", "response", "x", "y"), row.names = c(NA,
-24L), class = "data.frame")
model <- lm(response ~ level, data = layout)
summary(model)
Preguntas
- ¿Cómo puedo calcular una matriz de covarianza e incluirla en mi regresión?
- Los bloqueos son muy diferentes, y existen fuertes interacciones de bloque * de tratamiento. ¿Es apropiado analizarlos por separado?
r
spatial
linear-model
covariance
David LeBauer
fuente
fuente
Respuestas:
1) Puede modelar la correlación espacial con la
nlme
biblioteca; Hay varios modelos posibles que puede elegir. Ver páginas 260-266 de Pinheiro / Bates.Un buen primer paso es hacer un variograma para ver cómo la correlación depende de la distancia.
Aquí, el semivariograma de la muestra aumenta con la distancia, lo que indica que las observaciones están correlacionadas espacialmente.
Una opción para la estructura de correlación es una estructura esférica; eso podría modelarse de la siguiente manera.
Este modelo parece encajar mejor que el modelo sin estructura de correlación, aunque es muy posible que también se pueda mejorar con una de las otras posibles estructuras de correlación.
2) También puede intentar incluir
x
yy
directamente en el modelo; Esto podría ser apropiado si el patrón de correlación depende de algo más que la distancia. En su caso (mirando las imágenes de sesqu) parece que para este bloque de todos modos, puede tener un patrón diagonal.Aquí estoy actualizando el modelo original en lugar de m0 porque solo estoy cambiando los efectos fijos, por lo que ambos modelos deben ajustarse usando la máxima probabilidad.
Para comparar los tres modelos, deberá ajustarlos a todos
gls
y al método de máxima verosimilitud en lugar del método predeterminado de REML.Recuerde que, especialmente con su conocimiento del estudio, es posible que pueda llegar a un modelo que sea mejor que cualquiera de estos. Es decir, el modelo
m2b
no debe considerarse necesariamente como el mejor todavía.Nota: Estos cálculos se realizaron después de cambiar el valor x del gráfico 37 a 0.
fuente
model
lugar dem0
, por ejemplo.m2 <- update(m0, .~.+x*y)
para que los tres modelos se puedan comparar usandoanova(m0,m1,m2)
; después de hacer esto,m2
es un gran perdedor (AIC = 64) parece que tu partem0
,m1
ym2
como sugiere, recibe la advertencia:Fitted objects with different fixed effects. REML comparisons are not meaningful.
Para comparar efectos fijos, debe usar la probabilidad máxima regular en lugar de REML. Ver editar.1) ¿Cuál es su variable explicativa espacial? Parece que el plano x * y sería un modelo pobre para el efecto espacial.
2) Al ver cómo los bloques están separados 1 milla y espera ver efectos por solo 30 metros, diría que es completamente apropiado analizarlos por separado.
fuente