Nested / SplitModel - RepeatedMeasures / MixedModel ANOVA: niveles de anidamiento y scripting en R

Mi conjunto de datos tiene las siguientes variables:

Tratamiento (4 tipos- fijo)
Ubicación (8 ubicaciones- fijo)
Posición en la ubicación (3 posiciones por ubicación, fija)
Se toman muestras en cada posición (3 muestras por posición aleatoria)
- Tiempo (dos tiempos de muestreo - fijo)
- Tasa de mineralización (como resultado del análisis de muestras tomadas)

Se utilizan dos ubicaciones para evaluar cada tratamiento (es decir, 4 tratamientos, 2 ubicaciones por tratamiento, 8 ubicaciones en total).

Quiero hacer un ANOVA de medidas repetidas de parcela dividida (/ anidado?) (/ Modelo mixto?) Al Rusar las variables anteriores.

Q.1. ¿Suena esto adecuado?

Mi objetivo es ver si hay un efecto de 1) posición, 2) tratamiento, 3) tiempo y 4) interacción de todos (es decir, pos * treat *, pos * time, treat * time, pos * treat * time) en tasas de mineralización.

Q 2. ¿La ubicación está anidada en el tratamiento? ¿La muestra está anidada en posición?

Q 3. ¿Cuáles son los factores entre y dentro de los factores?

Q 4. ¿Cuál es el tema / argumento? - ¿Es la ubicación o posición o muestra o tasa?

P 5. ¿Cómo puedo poner el tiempo como medidas repetidas en mi fórmula R?

P 6. ¿Usaría aov, lme o ezANOVA?

Q 7. ¿Cómo codifico las variables independientes separadas y sus interacciones en una fórmula R adecuada?

Literalmente he estado tratando de resolver esto durante días y parece que no puedo encontrar una respuesta que tenga sentido ...

r anova repeated-measures split-plot nested-data Lorain
fuente

Usted menciona dos tiempos de muestreo como medidas repetidas, pero su descripción de las variables no parece incluirlo.

mnel

gracias por el comentario, lo he editado. Espero que sea más claro!

Lorain

Problema complicado! ¿La ubicación es fija o aleatoria? ¿La posición es fija o aleatoria? Supongo que la muestra es aleatoria.

Como el tratamiento se asigna a la ubicación, la ubicación es la unidad de muestreo. Básicamente, la comparación entre tratamientos se realiza a ese nivel. $n=8$ .
La unidad de medida es la observación que realiza en sus "muestras" en un momento dado.
La ubicación no está anidada en el tratamiento. El tratamiento se aplica a la ubicación.
La posición está anidada dentro de la ubicación.
La muestra está anidada en su posición interior.
El tiempo está anidado dentro de la muestra.
El tiempo se cruza con el tratamiento.

Tiene 3 niveles de anidamiento (tiempo dentro de la muestra, muestra dentro de la posición, posición dentro de la ubicación).

Si la ubicación, la posición y la muestra son aleatorias, creo que la fórmula R se verá así:

 Y ~ Treatment * Time +(1|location|position|sample)

Tiene 1 fila en su marco de datos para cada observación de muestra en cada momento, con codificaciones apropiadas para todas sus características de diseño.

¿Funcionaría combinar las medidas repetidas en una puntuación como su promedio o su diferencia? Eso podría hacer que el modelo sea más fácil de interpretar.

Placidia
fuente

+1, esta es una muy buena respuesta! Una cosa que me pregunto es: usted afirma que hay "3 niveles de anidamiento (ubicación, posición, muestra)" y también que "el tiempo está anidado dentro de la muestra". Hay un poco de tensión por estas afirmaciones. ¿Hay alguna manera de aclarar esto para mí?

gung - Restablece a Monica

Gracias por la recomendación. El tiempo es el último nivel del modelo, por lo que tiene tiempo <muestra <posición <ubicación. Pero he notado que el "final de la línea" en un modelo de efectos aleatorios generalmente no se conoce como un "nivel". En un modelo simple de medios

X = μ + ϵ

$X=\mu + \epsilon$ , el término de error es un efecto aleatorio, pero no hablamos de que un modelo tenga un nivel de anidamiento. Es solo semántica en este punto. He cambiado la redacción para que quede más claro.

Placidia

@Placidia, ¡muchas gracias por tu respuesta! Ya me ha ayudado mucho. Según su respuesta, he editado mi pregunta para incluir un poco más de información (por ejemplo, variables fijas). Tenía una pregunta sobre su fórmula R: el tiempo de tratamiento * significa que solo está buscando el efecto de la combinación de tratamiento con el tiempo, ¿verdad? También estoy interesado si la posición tiene un efecto. ¿Cómo agregaría esto a la fórmula?

Lorain

Con R, usaría lmer del paquete lme4. lme (de nlme) es una versión anterior de ese paquete. Las fórmulas se definen de formas ligeramente diferentes. el tiempo de tratamiento * incluye los efectos fijos para el tratamiento y el tiempo junto con su interacción.

Placidia

Si la ubicación y la posición son aleatorias, aún puede probar su efecto con lmer y la fórmula que le di. En ese caso, está probando si la varianza de esos componentes es> 0. Si la ubicación y la posición son fijas, se necesita una fórmula diferente. Es posible que desee leer una introducción a los modelos mixtos antes de continuar, ya que pueden ser complicados.

Placidia

Nested / SplitModel - RepeatedMeasures / MixedModel ANOVA: niveles de anidamiento y scripting en R

Respuestas: