Parcela dividida en R

8

Tengo un conjunto de datos de puntos de referencia submuestras en cada punto de referencia. Ejecuto estos puntos de referencia y sus submuestras en máquinas de sujetos . El "individuo" estudiado por las submuestras es el mismo para cada máquina sujeto, y los puntos de referencia son los mismos para cada máquina sujeto.nmp

¿Cómo llevo a cabo un ANOVA en R en esta situación?

Principalmente quiero calcular la media total y los intervalos de confianza. No me importan los medios de submuestra en absoluto, pero quiero reconocer la replicación allí en la confianza y los medios finales. Sin embargo, me pueden interesar los medios de referencia. No puedo averiguar cómo configurar este anova en R. Quiero poder replicar los medios mediante el cálculo manual.

He tratado glm, anova, aov, y lmeaunque estoy totalmente confundido. Creo que los resultados de ANOVA deberían ser equivalentes para dos máquinas sujetas a la media anidada de máquina / punto de referencia / punto de control, pero las medias no son las mismas cuando las pruebo.

Editar:

Estoy empezando a obtener una pista de http://zoonek2.free.fr/UNIX/48_R/13.html

Alex Brown
fuente
1
Esta pregunta ha sido formulada varias veces en esta lista. Esta es la respuesta corta. Escribo una respuesta detallada más tarde en el día.
suncoolsu
Gracias por su pronta respuesta. Lamento no haber encontrado las otras respuestas, pero aún no estoy lo suficientemente al tanto de la terminología para saber cómo hacer la pregunta.
Alex Brown
Creo que todos estamos aprendiendo aquí. ¡Está bien!
suncoolsu

Respuestas:

13

La principal diferencia entre el diseño de parcelas divididas y otros diseños, como el diseño completamente al azar y las variaciones de los diseños de bloques, es la estructura de anidación de los sujetos, es decir, cuando las observaciones se obtienen del mismo sujeto (unidad experimental) más de una vez. Esto conduce a una estructura de correlación dentro de un sujeto en un diseño de diagrama dividido que es diferente de la estructura de correlación en un bloque.

Tomemos una imagen de ejemplo del conjunto de datos de un diseño simple de parcela dividida (a continuación). Este es un estudio de composición dietética en salud, se asignaron al azar cuatro dietas a 12 sujetos, todos con un estado de salud similar. Se estableció la presión arterial basal y una medida de salud fue el cambio de la presión arterial después de dos semanas. La presión arterial se midió por la mañana y por la tarde. (El ejemplo se copia del libro de diseño estadístico Casella, ejemplo 5.1)

 Diet1Diet2Diet3Diet4 SubjectSubjectSubjectSubject 123456789101112MorningxxxxxxxxxxxxEveningxxxxxxxxxxxx

Algunas cosas importantes a tener en cuenta:

  • Hay 12 unidades experimentales (12 sujetos)
  • En estas 12 unidades observamos 24 puntos de datos ( 2×4×3), denotado por x
  • Esto es así porque tomamos dos observaciones sobre el mismo tema, primero por la mañana y segundo por la tarde.
  • Esto significa que las dos observaciones sobre un tema son de la misma unidad experimental. Por lo tanto, esto no es una replicación verdadera. Debido a que las observaciones se toman del mismo tema en el transcurso del tiempo, debe haber alguna correlación entre las dos observaciones.
  • Tenga en cuenta que esto es diferente de un ANOVA de dos vías con la dieta y el tiempo como factores.
  • Un ANOVA de dos vías tendrá observaciones como esta:

 Diet1Diet2Diet3Diet4MorningxxxxxxxxxxxxEveningxxxxxxxxxxxx

cada una de las xAquí hay diferentes temas. Esto ilustra el concepto de anidamiento. Es decir, los sujetos 1, 2, 3 están anidados en la Dieta 1. - Las parcelas completas, las unidades experimentales en el nivel de la parcela completa (Dieta) (los Sujetos) actúan como bloques para el tratamiento de la parcela dividida (Mañana-Tarde)

El modelo para este diseño de parcela dividida es:

Yijk=μ+τi+Sij+γk+(τγ)ik+ϵijk,
dónde
Yijk=the response to diet i of subject j at time k,
τi=diet i effect
Syoj=efecto del sujeto j en la dieta i (error de trama completo)
(τγ)yok=la interacción de la dieta i y el tiempo j
ϵyojk=error de parcela dividida
Una vez que tenga el modelo bien formulado, escribir en R aovforma es trivial:
splitPltMdl <- aov(bloodPressure ~ Diet + ## Diet effect 
                                   Error(Subject/Diet) + ## nesting of Subject in Diet 
                                   Time*Diet, ## interaction of Time and Diet 
                                   data = dietData)
suncoolsu
fuente
1
+1 buena respuesta. Si ahora pudiera explicarme cómo hace algunas pruebas post-hoc o comparaciones planificadas (por ejemplo, si hay una diferencia entre la mañana y la tarde en los grupos 1 y 2, agrupados), me respondería muchas preguntas. Vea también mi pregunta sobre R-help: article.gmane.org/gmane.comp.lang.r.general/237681
Henrik
Estoy un poco ocupado en este momento. Definitivamente voy a volver a usted.
suncoolsu
@suncoolsu: ... seguramente entregará?
russellpierce
¿Por qué no incluye el efecto Tiempo en la fórmula de su modelo? ¿Por qué incluyes Diety Time*Dieten la aovllamada? Debe ser Time:Dietpara que coincida con su fórmula matemática.
ameba