¿Por qué se prefiere la prueba de Mantel sobre la I de Moran?

37

La prueba de Mantel se usa ampliamente en estudios biológicos para examinar la correlación entre la distribución espacial de los animales (posición en el espacio) con, por ejemplo, su relación genética, tasa de agresión o algún otro atributo. Muchas buenas revistas lo están utilizando ( PNAS, Animal Behavior, Molecular Ecology ... ).

He fabricado algunos patrones que pueden ocurrir en la naturaleza, pero la prueba de Mantel parece ser bastante inútil para detectarlos. Por otro lado, Moran's tuve mejores resultados (ver valores p debajo de cada gráfico) .

¿Por qué los científicos no usan el yo de Moran? ¿Hay alguna razón oculta que no veo? Y si hay alguna razón, ¿cómo puedo saber (cómo se deben construir las hipótesis de manera diferente) para usar adecuadamente la prueba I de Mantel o Moran? Un ejemplo de la vida real será útil.

Imagine esta situación: hay un huerto (17 x 17 árboles) con un cuervo sentado en cada árbol. Los niveles de "ruido" para cada cuervo están disponibles y usted desea saber si la distribución espacial de los cuervos está determinada por el ruido que hacen.

Hay (al menos) 5 posibilidades:

  1. "Dios los cría y ellos se juntan." Los cuervos más similares son, menor es la distancia geográfica entre ellos (grupo único) .

  2. "Dios los cría y ellos se juntan." Una vez más, cuanto más parecidos son los cuervos, menor es la distancia geográfica entre ellos (varios grupos), pero un grupo de cuervos ruidosos no tiene conocimiento de la existencia de un segundo grupo (de lo contrario, se fusionarían en un gran grupo).

  3. "Tendencia monotónica".

  4. "Los opuestos se atraen." Cuervos similares no se soportan entre sí.

  5. "Patrón aleatorio." El nivel de ruido no tiene un efecto significativo en la distribución espacial.

Para cada caso, creé una gráfica de puntos y usé la prueba de Mantel para calcular una correlación (no es sorprendente que sus resultados no sean significativos, nunca trataría de encontrar una asociación lineal entre tales patrones de puntos).

ingrese la descripción de la imagen aquí


Datos de ejemplo: (comprimido como sea posible)

r.gen   <- seq(-100,100,5)
r.val   <- sample(r.gen, 289, replace=TRUE)
z10     <- rep(0, times=10)
z11     <- rep(0, times=11)
r5      <- c(5,15,25,15,5)
r71     <- c(5,20,40,50,40,20,5)
r72     <- c(15,40,60,75,60,40,15)
r73     <- c(25,50,75,100,75,50,25)
rbPal   <- colorRampPalette(c("blue","red"))
my.data <- data.frame(x = rep(1:17, times=17),y = rep(1:17, each=17),
             c1=c(rep(0,times=155),r5,z11,r71,z10,r72,z10,r73,z10,r72,z10,r71,
             z11,r5,rep(0, times=27)),c2 = c(rep(0,times=19),r5,z11,r71,z10,r72,
             z10,r73,z10,r72,z10,r71,z11,r5,rep(0, times=29),r5,z11,r71,z10,r72,
             z10,r73,z10,r72,z10,r71,z11,r5,rep(0, times=27)),c3 = c(seq(20,100,5),
             seq(15,95,5),seq(10,90,5),seq(5,85,5),seq(0,80,5),seq(-5,75,5),
             seq(-10,70,5),seq(-15,65,5),seq(-20,60,5),seq(-25,55,5),seq(-30,50,5),
             seq(-35,45,5),seq(-40,40,5),seq(-45,35,5),seq(-50,30,5),seq(-55,25,5),
             seq(-60,20,5)),c4 = rep(c(0,100), length=289),c5 = sample(r.gen, 289, 
             replace=TRUE))

# adding colors
my.data$Col1 <- rbPal(10)[as.numeric(cut(my.data$c1,breaks = 10))]
my.data$Col2 <- rbPal(10)[as.numeric(cut(my.data$c2,breaks = 10))]
my.data$Col3 <- rbPal(10)[as.numeric(cut(my.data$c3,breaks = 10))]
my.data$Col4 <- rbPal(10)[as.numeric(cut(my.data$c4,breaks = 10))]
my.data$Col5 <- rbPal(10)[as.numeric(cut(my.data$c5,breaks = 10))]

La creación de la matriz de distancias geográficas (por I de Moran se invierte):

point.dists           <- dist(cbind(my.data$x, my.data$y))
point.dists.inv       <- 1/point.dists
point.dists.inv       <- as.matrix(point.dists.inv)
diag(point.dists.inv) <- 0

creación Terreno:

X11(width=12, height=6)
par(mfrow=c(2,5))
par(mar=c(1,1,1,1))

library(ape)
for (i in 3:7) {
  my.res <- mantel.test(as.matrix(dist(my.data[ ,i])), as.matrix(point.dists))
  plot(my.data$x,my.data$y,pch=20,col=my.data[ ,c(i+5)], cex=2.5, xlab="", 
       ylab="", xaxt="n", yaxt="n", ylim=c(-4.5,17))
  text(4.5, -2.25, paste("Mantel's test", "\n z.stat =", round(my.res$z.stat, 
   2), "\n p.value =", round(my.res$p, 3)))

  my.res <- Moran.I(my.data[ ,i], point.dists.inv)
  text(12.5, -2.25, paste("Moran's I", "\n observed =", round(my.res$observed, 
   3), "\n expected =",round(my.res$expected,3), "\n std.dev =", 
       round(my.res$sd,3), "\n p.value =", round(my.res$p.value, 3)))
}

par(mar=c(5,4,4,2)+0.1)

for (i in 3:7) {
  plot(dist(my.data[ ,i]), point.dists,pch = 20, xlab="geographical distance", 
       ylab="behavioural distance")
}

PS en los ejemplos en el sitio web de Ayuda de Estadísticas de la UCLA, ambas pruebas son usados en los mismos datos exacta y la misma hipótesis exacta, que es no es muy útil (véase, prueba de Mantel , de Moran I ).

Respuesta a la IM Tiene escritura:

... es [Mantel] Comprueba si cuervos tranquilas se encuentra cerca de otros cuervos tranquilas, mientras que los cuervos ruidosos tienen vecinos ruidosos.

Creo que tal hipótesis NO podría ser probada por la prueba de Mantel . En ambas parcelas la hipótesis es válida. Pero si supone que un grupo de cuervos no ruidosos puede no tener conocimiento sobre la existencia de un segundo grupo de cuervos no ruidosos, la prueba de Mantels es nuevamente inútil. Dicha separación debería ser muy probable en la naturaleza (principalmente cuando se realiza la recopilación de datos a mayor escala).

ingrese la descripción de la imagen aquí

Ladislav Naďo
fuente

Respuestas:

19

La prueba de Mantel y la de Moran me refiero a dos conceptos muy diferentes.

La razón para usar la I de Moran es la cuestión de la autocorrelación espacial: correlación de una variable consigo misma a través del espacio. Uno usa el I de Moran cuando quiere saber en qué medida la ocurrencia de un evento en una unidad de área hace más probable o improbable que ocurra en una unidad de área vecina. En otras palabras (usando su ejemplo): si hay un cuervo ruidoso en un árbol, ¿qué tan probable o improbable hay otros cuervos ruidosos en el vecindario? La hipótesis nula para el I de Moran no es la autocorrelación espacial en la variable de interés.

La razón para usar la prueba de Mantel es la cuestión de las similitudes o diferencias entre las variables. Uno usa la prueba de Mantel cuando quiere saber si las muestras que son similares en términos de las variables predictoras (espacio) también tienden a ser similares en términos de la variable dependiente (especie). En pocas palabras: ¿las muestras que están juntas también son compositivamente similares y las muestras que están espacialmente distantes entre sí también son compositivamente diferentes? Usando su ejemplo: prueba si los cuervos silenciosos se encuentran cerca de otros cuervos silenciosos, mientras que los cuervos ruidosos tienen vecinos ruidosos. La hipótesis nula no es la relación entre la ubicación espacial y la DV.
Además de esto, la prueba de Mantel parcial permite comparar dos variables mientras se controla una tercera.
Por ejemplo, uno necesita la prueba de Mantel cuando compara

  • Dos grupos de organismos, que forman el mismo conjunto de unidades de muestra;
  • Estructura comunitaria antes y después de la perturbación;
  • Distancia genética / ecológica y distancia geográfica.

aquí hay una buena discusión sobre la prueba de Mantel y su aplicación.

(Editado en respuesta a los nuevos ejemplos de Ladislav Nado)

Si puedo adivinar, la razón de su confusión es que sigue pensando en el espacio y el ruido en sus ejemplos, ya sea como dos variables continuas o como una matriz de distancia (posición en el espacio) y una variable continua (ruido). De hecho, para analizar las similitudes entre dos de estas variables, uno debe pensar en ambas como matrices de distancia . Es decir:

  • Una matriz (por ejemplo, para el espacio) describe las diferencias para cada par de coordenadas geográficas. El valor para 2 cuervos sentados uno al lado del otro es menor que el valor para los cuervos sentados muy separados;
  • otra matriz (para estructura ambiental, genética o de cualquier otro tipo) describe las diferencias entre los resultados medidos en puntos determinados. El valor para 2 cuervos con un nivel de ruido similar (no importa si son silenciosos o ruidosos, ¡es solo una medida de similitud!) Es menor que el valor para un par de cuervos con niveles de ruido diferentes.

Luego, la prueba de Mantel calcula el producto cruzado de los valores correspondientes en estas dos matrices. Permítanme subrayar nuevamente que la estadística de Mantel es la correlación entre dos matrices de distancia y no es equivalente a la correlación entre las variables , utilizada para formar esas matrices.

Ahora tomemos dos estructuras que mostró en las imágenes A y B.
En la imagen A, la distancia en cada par de cuervos corresponde a similitudes en su nivel de ruido. Los cuervos con pequeñas diferencias en su nivel de ruido (cada cuervo silencioso versus otro cuervo silencioso, cada cuervo ruidoso versus otro cuervo ruidoso) permanecen cerca, mientras que cada par de cuervos con gran diferencia en su nivel de ruido (un cuervo silencioso) contra un cuervo ruidoso) manténgase alejado el uno del otro. La prueba de Mantel muestra correctamente que existe una correlación espacial entre las dos matrices.
En la imagen B, sin embargo, la distancia entre cuervos nocorresponden a las similitudes en su nivel de ruido. Si bien todos los cuervos ruidosos permanecen juntos, los cuervos silenciosos pueden o no permanecer cerca. De hecho, la distancia en algunos pares de cuervos diferentes (uno silencioso + uno ruidoso) es menor que la distancia para algunos pares de cuervos similares (cuando ambos están tranquilos).
No hay evidencia en la imagen B de que si un investigador toma dos cuervos similares al azar, serían vecinos. No hay evidencia de que si un investigador recoge dos cuervos vecinos (o no tan distantes) al azar, serían similares. Por lo tanto, la afirmación inicial que On both plots the hypothesis valides incorrecta. La estructura como en la imagen B no muestra correlación espacial entre las dos matrices y, en consecuencia, falla la prueba de Mantel.

Por supuesto, existen en realidad diferentes tipos de estructuras (con uno o más grupos de objetos similares o sin bordes claros de grupo). Y la prueba Mantel es perfectamente aplicable y muy útil para probar lo que prueba. Si puedo recomendar otra buena lectura, este artículo utiliza datos reales y analiza la prueba de Moran I, Geary c y Mantel en términos bastante simples y comprensibles.

Espero que todo esté un poco más claro ahora; Sin embargo, puedo ampliar esta explicación si sientes que todavía falta algo.

SOY
fuente
1
gracias por su respuesta, pero creo que la hipótesis que escribe (de la hipótesis de la prueba de Mantel de la vida real) no es útil con los datos de la vida real. Agrego mi respuesta a usted arriba, me alegraré mucho si responde al respecto. Tal vez yo estoy equivocado.
Ladislav Naďo
@Ladislav Nado He actualizado la respuesta. No dude en solicitar más explicaciones, si es necesario.
MI
Muchas gracias, cuando "revisé" los artículos que me recomendó, finalmente entendí.
Ladislav Naďo
1
@LadislavNado ¡Genial! Me alegra ser de ayuda.
MI