Dada la siguiente configuración experimental:
Se toman múltiples muestras de un sujeto y cada muestra se trata de múltiples maneras (incluido un tratamiento de control). Lo que es principalmente interesante es la diferencia entre el control y cada tratamiento.
Puedo pensar en dos modelos simples para estos datos. Con la muestra , el tratamiento , el tratamiento 0 es el control, deje ser los datos, sea la línea de base para la muestra , sea la diferencia para el tratamiento . El primer modelo analiza tanto el control como la diferencia:j Y i j γ i i δ j j
δ 0 = 0
Mientras que el segundo modelo solo mira la diferencia. Si calculamos previamente antemano entonces d i j = Y i j - Y i 0 d i j = δ j + ε i j
Mi pregunta es ¿cuáles son las diferencias fundamentales entre estas dos configuraciones? En particular, si los niveles no tienen sentido en sí mismos y solo importa la diferencia, ¿el primer modelo está haciendo demasiado y quizás tenga poca potencia?
fuente
Respuestas:
Es probable que el esté correlacionado en el segundo modelo, pero no en el primero.ϵyo j
En el primero, estos términos representan errores de medición y desviaciones del modelo aditivo. Con un cuidado razonable, como aleatorizar la secuencia de mediciones, esos errores pueden hacerse independientes cuando el modelo es preciso. De dónde
(Tenga en cuenta que esto contradice la última ecuación en la pregunta, porque es incorrecto suponer Hacerlo nos obligaría a reconocer que las son variables aleatorias en lugar de parámetros, al menos una vez que reconocemos el posibilidad de error de medición para el control. Esto llevaría a las mismas conclusiones a continuación.)ϵi0=0 γi
Para , esto implicaj,k≠0 j≠k
La correlación puede ser sustancial. Para errores iid, un cálculo similar muestra que es igual a 0.5. A menos que esté utilizando procedimientos que manejen esta correlación de manera explícita y correcta, favorezca el primer modelo sobre el segundo.
fuente