Imagine el siguiente diseño común:
- 100 participantes son asignados aleatoriamente a un grupo de tratamiento o control
- la variable dependiente es numérica y medida antes y después del tratamiento
Tres opciones obvias para analizar tales datos son:
- Probar el efecto de interacción grupal por tiempo en ANOVA mixto
- Realice un ANCOVA con condición como IV y la medida previa como covariable y medida posterior como DV
- Haga una prueba t con la condición de IV y los puntajes de cambio pre-post como DV
Pregunta:
- ¿Cuál es la mejor manera de analizar dichos datos?
- ¿Hay razones para preferir un enfoque sobre otro?
anova
ancova
clinical-trials
change-scores
Jeromy Anglim
fuente
fuente
Respuestas:
Hay una gran literatura sobre este tema (puntajes de cambio / ganancia), y creo que las mejores referencias provienen del dominio biomédico, por ejemplo
En la investigación biomédica, también se ha realizado un trabajo interesante en el estudio de ensayos cruzados (especialmente en relación con los efectos de arrastre , aunque no sé cuán aplicable es a su estudio).
Desde Gain Score t hasta ANCOVA F (y viceversa) , de Knapp & Schaffer, proporciona una revisión interesante del enfoque ANCOVA vs. t (la llamada paradoja del Señor). El análisis simple de las puntuaciones de cambio no es la forma recomendada para el diseño previo / posterior de acuerdo con Senn en su artículo Cambio desde la línea de base y el análisis de covarianza revisitado (Stat. Med. 2006 25 (24)). Además, usar un modelo de efectos mixtos (por ejemplo, para tener en cuenta la correlación entre los dos puntos de tiempo) no es mejor porque realmente necesita usar la medición "pre" como una covariable para aumentar la precisión (a través del ajuste). Muy corto:
También me gustan los diez mitos de puntuación de diferencias de Edwards, aunque se centra en las puntuaciones de diferencia en un contexto diferente; pero aquí hay una bibliografía anotada sobre el análisis del cambio previo y posterior (desafortunadamente, no cubre trabajos muy recientes). Van Breukelen también comparó ANOVA versus ANCOVA en un entorno aleatorio y no aleatorio, y sus conclusiones respaldan la idea de que ANCOVA es preferible, al menos en estudios aleatorios (que evitan la regresión al efecto medio).
fuente
Daniel B. Wright analiza esto en la sección 5 de su artículo Hacer amigos con sus datos . Él sugiere (p.130):
Recomienda los siguientes artículos como lecturas adicionales:
fuente
Las estrategias más comunes serían:
Hay muchas discusiones sobre la interpretación, los supuestos y las diferencias aparentemente paradójicas entre estos dos enfoques y sobre alternativas más sofisticadas (especialmente cuando los participantes no pueden ser asignados al azar al tratamiento), pero creo que siguen siendo bastante estándar.
Una fuente importante de confusión es que para el ANOVA, el efecto de interés es muy probablemente la interacción entre el tiempo y el tratamiento y no el efecto principal del tratamiento. Por cierto, la prueba F para este término de interacción arrojará exactamente el mismo resultado que una prueba t de muestra independiente en puntajes de ganancia (es decir, puntajes obtenidos restando el puntaje previo al examen del puntaje posterior a la prueba para cada participante) para que pueda También ve por eso.
Si todo esto es demasiado, no tiene tiempo para resolverlo, y no puede obtener ayuda de un estadístico, un enfoque rápido y sucio pero de ninguna manera completamente absurdo sería simplemente comparar los puntajes posteriores a la prueba con un prueba t de muestra independiente, ignorando los valores previos a la prueba. Esto solo tiene sentido si los participantes fueron asignados aleatoriamente al grupo de tratamiento o control .
Finalmente, esa no es en sí misma una buena razón para elegirlo, pero sospecho que el enfoque 2 anterior (ANCOVA) es lo que actualmente pasa por el enfoque correcto en psicología, por lo que si elige otra cosa, es posible que tenga que explicar la técnica en detalle o justificar usted mismo a alguien que está convencido, por ejemplo, que "se sabe que las puntuaciones de ganancia son malas".
fuente
ANCOVA y medidas repetidas / modelo mixto para término de interacción están probando dos hipótesis diferentes. Consulte este artículo: artículo 1 y este artículo: artículo 2
fuente
Dado que tiene dos medios (ya sea de un artículo específico o de la suma del inventario), no hay razón para considerar un ANOVA. Una prueba t pareada es probablemente apropiada; Esto puede ayudarlo a elegir qué prueba t necesita.
¿Desea ver los resultados específicos del elemento o las puntuaciones generales? Si desea hacer un análisis de elementos, este podría ser un punto de partida útil.
fuente