Me dieron datos para analizar en un estudio que analizaba los efectos de un tratamiento sobre los niveles de hierro en cuatro puntos de tiempo diferentes (antes del tratamiento, el día en que finalizó el tratamiento, 4 semanas después del tratamiento y 2-4 meses después del tratamiento). No hay grupo de control. Están buscando ver si hay aumentos significativos en los niveles de hierro en cada uno de los 3 puntos de tiempo posteriores al tratamiento al nivel anterior al tratamiento (basal). Once pacientes tenían niveles basales, pero solo 8 pacientes tenían datos completos para los 4 puntos de tiempo ( = 11, 10, 9 y 8 para cada punto de tiempo). No solo se midieron los niveles de hierro, sino que se tomaron otras dos medidas de laboratorio en cada punto de tiempo para compararlas con la línea de base.
Tengo algunas preguntas sobre cómo analizar esto. Primero pensé que un ANOVA RM sería apropiado para analizar estos datos, pero estaba preocupado por el pequeño tamaño de la muestra, la pérdida de datos y la distribución no normal de los datos. Luego consideré comparar cada medida posterior al tratamiento con la línea de base usando las pruebas de Wilcoxon de rango con signo, pero luego me encontré con el tema de las comparaciones múltiples. Sin embargo, he leído algo de literatura que minimiza la necesidad de ejecutar múltiples comparaciones. Entonces, en general, estoy tratando con tamaños de muestra pequeños, datos incompletos y comparaciones múltiples (y si es necesario o no).
Espero que todo esto tenga sentido. Soy nuevo en CrossValidated y un colega me dirigió aquí como un lugar para aprender de estadísticos experimentados, ¡así que agradecería cualquier consejo! ¡Gracias!
Editado para agregar datos sin procesar del comentario:
Hay cuatro puntos de tiempo totales y la variable de resultado es continua. Por ejemplo, los resultados en cada punto de tiempo se parecen a esto:
Baseline (n=11): [2, 7, 7, 3, 6, 3, 2, 4, 4, 3, 14]
1st Post (n=10): [167, 200, 45, 132, ., 245, 199, 177, 134, 298, 111]
2nd Post (n=9): [75, 43, 23, 98, 87, ., 300, ., 118, 202, 156]
3rd Post (n=8): [23, 34, 98, 112, ., 200, ., 156, 54, 18, .]
Respuestas:
He repensado su problema y encontré la prueba de Friedman, que es una versión no paramétrica de un ANOVA unidireccional con medidas repetidas .
Espero que tengas algunas habilidades básicas con
R
.Realizar la prueba de Friedman ...
y luego encuentre entre qué grupos existe la diferencia mediante una prueba post-hoc no paramétrica . Aquí tienes todas las comparaciones posibles.
Como puede ver, solo la línea de base (primer punto de tiempo) es estadísticamente diferente de los demás.
Espero que esto ayude.
fuente
Si no conoce la distribución de los cambios individuales a lo largo del tiempo, no puede aproximarla con la distribución de las diferencias entre pacientes. Por ejemplo, si tiene 10 pacientes con niveles de hierro respectivos (510,520, ..., 600) antes del tratamiento y (520,530, ..., 610) después del tratamiento, el ANOVA de Kruskal-Wallis (o cualquier otro algoritmo similar) afirmaría que no hay un cambio significativo en los niveles de hierro.
En mi humilde opinión, sin el grupo de control, lo mejor que puede hacer es contar cuántos pacientes aumentaron su nivel de hierro y cuántos lo disminuyeron, y probar la importancia de esto.
Dicho esto, si el KW ANOVA le dice que hay un nivel significativo de hierro, lo es (sin falsos positivos).
fuente