Diseño de modelo de efectos mixtos con una variable de muestreo.

11

Estoy tratando de especificar una fórmula para un modelo lineal de efectos mixtos (con lme4) para mi diseño experimental, pero no estoy seguro de que lo esté haciendo bien.

El diseño: básicamente estoy midiendo un parámetro de respuesta en plantas. Tengo 4 niveles de tratamiento y 2 niveles de riego. Las plantas se agrupan en 16 parcelas, dentro de cada parcela muestro 4 subparcelas. En cada subparcela, tomo entre 15 y 30 observaciones (dependiendo del número de plantas encontradas). Es decir, hay un total de 1500 filas.

ingrese la descripción de la imagen aquí

Inicialmente, el nivel de subtrama estaba aquí solo para fines de muestreo, pero pensé que me gustaría tenerlo en cuenta en el modelo (como una variable de 64 niveles) porque vi que había mucha variabilidad de una subtrama a otra , incluso dentro del mismo gráfico (mayor que la variabilidad entre gráficos completos).

Mi primera idea fue escribir:

library(lme4)
fit <- lmer(y ~ treatment*irrigation + (1|subplot/plot), data=mydata)

o

fit <- lmer(y ~ treatment*irrigation + (1|subplot) + (1|plot), data=mydata)

¿Es eso correcto? No estoy seguro de si debo mantener ambos niveles de trama / subtrama en mi fórmula. Ningún efecto fijo es significativo, pero los efectos aleatorios son muy significativos.

agenis
fuente

Respuestas:

9

Su modelo debe escribirse como

fit <- lmer(y ~ treatment*irrigation + (1|plot/subplot), data=mydata)

ya que las subtramas están anidadas dentro del sitio. aunque (1|plot)+ (1|subplot)funcionaría si las subtramas se etiquetan de forma exclusiva (es decir, 1A, 1B, 1C, ..., 2A, 2B, 2C en lugar de A, B, C ..., A, B, C). El capítulo de mi libro de Fox et al. Estadísticas ecológicas describe un ejemplo de anidación:

Por otro lado, en el ejemplo de la garrapata, cada pollito ocurre en una sola cría, y cada cría ocurre en un solo sitio: la especificación del modelo es (1 | SITE/BROOD/INDEX), leer como "pollito (ÍNDICE) anidado dentro de la cría anidado dentro del sitio", o equivalente (1 | SITE) + (1 | SITE:BROOD) + (1 | SITE:BROOD:INDEX). Si las crías y los polluelos están etiquetados de manera única, para que el software pueda detectar el anidamiento, (1 | SITE) + (1 | BROOD) + (1 | INDEX)también funcionará (no lo use (1 | SITE) + (1 | SITE/BROOD) + (1 | SITE/BROOD/INDEX); dará lugar a términos redundantes en el modelo).

Otros pensamientos:

  • Más información sobre anidamiento y especificaciones del modelo en http://glmm.wikidot.com/faq
  • ¿Sus tratamientos de riego están realmente organizados como se muestra en el esquema anterior, es decir, no intercalados? ¿O es solo por conveniencia de la presentación gráfica? Si es lo primero, entonces tiene un diseño experimental potencialmente problemático ...
  • Dado que las subtramas están anidadas dentro de los sitios, estaría bien inferencialmente (siguiendo Murtaugh 2007 Ecology "Simplicidad y complejidad en el análisis de datos ecológicos" ) tomar los medios de la trama y analizar los datos a nivel de la parcela.
  • Por lo que vale, creo que podría ir aún más lejos y agregarse al nivel de la trama; entonces puedes saltarte modelos mixtos por completo y simplemente hacerlm(y~treatment*irrigation, data=my_aggregated_data)
Ben Bolker
fuente
gracias por su ayuda (tengo 12h para esperar para desbloquear el +50 :( de hecho, tenía grandes dudas sobre el nombre de mis subtramas (4 o 64 etiquetas únicas). La cifra es correcta: el riego no es "aleatorio", eso es desafortunado estoy de acuerdo (me dijeron: "¡demasiado expansivo para hacerlo de manera diferente"!). Gracias por los enlaces. Una pregunta más: obtengo un gráfico de residuos que no se ve bien: en forma de cono (como este: "<"), error parece proporcional a los valores de Y. ¿Hay alguna manera de corregir esto en este tipo de modelo?
agenis
1
La solución más obvia (y que a menudo soluciona otros problemas) es transformar la respuesta, con mayor frecuencia la transformación de registros.
Ben Bolker