Medidas repetidas en el tiempo con

Me dieron datos para analizar en un estudio que analizaba los efectos de un tratamiento sobre los niveles de hierro en cuatro puntos de tiempo diferentes (antes del tratamiento, el día en que finalizó el tratamiento, 4 semanas después del tratamiento y 2-4 meses después del tratamiento). No hay grupo de control. Están buscando ver si hay aumentos significativos en los niveles de hierro en cada uno de los 3 puntos de tiempo posteriores al tratamiento al nivel anterior al tratamiento (basal). Once pacientes tenían niveles basales, pero solo 8 pacientes tenían datos completos para los 4 puntos de tiempo ( = 11, 10, 9 y 8 para cada punto de tiempo). No solo se midieron los niveles de hierro, sino que se tomaron otras dos medidas de laboratorio en cada punto de tiempo para compararlas con la línea de base. $n$

Tengo algunas preguntas sobre cómo analizar esto. Primero pensé que un ANOVA RM sería apropiado para analizar estos datos, pero estaba preocupado por el pequeño tamaño de la muestra, la pérdida de datos y la distribución no normal de los datos. Luego consideré comparar cada medida posterior al tratamiento con la línea de base usando las pruebas de Wilcoxon de rango con signo, pero luego me encontré con el tema de las comparaciones múltiples. Sin embargo, he leído algo de literatura que minimiza la necesidad de ejecutar múltiples comparaciones. Entonces, en general, estoy tratando con tamaños de muestra pequeños, datos incompletos y comparaciones múltiples (y si es necesario o no).

Espero que todo esto tenga sentido. Soy nuevo en CrossValidated y un colega me dirigió aquí como un lugar para aprender de estadísticos experimentados, ¡así que agradecería cualquier consejo! ¡Gracias!

Editado para agregar datos sin procesar del comentario:

Hay cuatro puntos de tiempo totales y la variable de resultado es continua. Por ejemplo, los resultados en cada punto de tiempo se parecen a esto:

 Baseline (n=11): [2, 7, 7, 3, 6, 3, 2, 4, 4, 3, 14] 
 1st Post (n=10): [167, 200, 45, 132, ., 245, 199, 177, 134, 298, 111]
 2nd Post (n=9):  [75, 43, 23, 98, 87, ., 300, ., 118, 202, 156]
 3rd Post (n=8):  [23, 34, 98, 112, ., 200, ., 156, 54, 18, .]

repeated-measures multiple-comparisons wilcoxon-signed-rank msturm17
fuente

Si agrega un ejemplo reproducible (o datos sin procesar) sería útil.

Ladislav Naďo

La variable de resultado es continua. Por ejemplo, los resultados en cada punto de tiempo son similares a esto: Niveles de referencia n = 11: [2, 7, 7, 3, 6, 3, 2, 4, 4, 3, 14]. 1.er puesto n = 10 [167, 200, 45, 132,., 245, 199, 177, 134, 298, 111]. Segundo puesto n = 9 [75, 43, 23, 98, 87,., 300,., 118, 202, 156]. Nivel del 3er puesto n = 8 [23, 34, 98, 112,., 200,., 156, 54, 18,.]. Hay cuatro puntos de tiempo total.

msturm17

Respuestas:

He repensado su problema y encontré la prueba de Friedman, que es una versión no paramétrica de un ANOVA unidireccional con medidas repetidas .

Espero que tengas algunas habilidades básicas con R.

# Creating a source data.frame
my.data<-data.frame(value=c(2,7,7,3,6,3,2,4,4,3,14,167,200,45,132,NA,
245,199,177,134,298,111,75,43,23,98,87,NA,300,NA,118,202,156,23,34,98,
112,NA,200,NA,156,54,18,NA),
post.no=rep(c("baseline","post1","post2","post3"), each=11),
ID=rep(c(1:11), times=4))

# you must install this library
library(pgirmess)

Realizar la prueba de Friedman ...

friedman.test(my.data$value,my.data$post.no,my.data$ID)

    Friedman rank sum test

data:  my.data$value, my.data$post.no and my.data$ID
Friedman chi-squared = 14.6, df = 3, p-value = 0.002192

y luego encuentre entre qué grupos existe la diferencia mediante una prueba post-hoc no paramétrica . Aquí tienes todas las comparaciones posibles.

friedmanmc(my.data$value,my.data$post.no,my.data$ID)
Multiple comparisons between groups after Friedman test 
p.value: 0.05 
Comparisons
               obs.dif critical.dif difference
baseline-post1      25     15.97544       TRUE
baseline-post2      21     15.97544       TRUE
baseline-post3      20     15.97544       TRUE
post1-post2          4     15.97544      FALSE
post1-post3          5     15.97544      FALSE
post2-post3          1     15.97544      FALSE

Como puede ver, solo la línea de base (primer punto de tiempo) es estadísticamente diferente de los demás.

Espero que esto ayude.

Ladislav Naďo
fuente

Ladislav, esta es una excelente respuesta a esta pregunta. Es extremadamente completo y completo. El único problema que veo es que los ANOVA de Kruskal-Wallis también tienen una suposición de independencia de las observaciones, de modo que hay diferentes sujetos en cada nivel de la variable independiente, que en este caso, no tenemos ya que estamos siguiendo el mismo 11 pacientes en 4 puntos de tiempo. ¿Tiene alguna opinión al respecto o tiene otros métodos en mente para abordar este problema? ¡Muchas gracias!

Matt Reichenbach

Eliminé mi comentario anterior. Finalmente encontré una mejor prueba. ¡A disfrutar!

Ladislav Naďo

Esta no es mi pregunta original, @ msturm17, tendrá que aceptar su respuesta, ¡aunque le di la recompensa!

Matt Reichenbach

¡Gracias, Ladislav, por tomarse el tiempo de responder a mi pregunta!

msturm17

Si no conoce la distribución de los cambios individuales a lo largo del tiempo, no puede aproximarla con la distribución de las diferencias entre pacientes. Por ejemplo, si tiene 10 pacientes con niveles de hierro respectivos (510,520, ..., 600) antes del tratamiento y (520,530, ..., 610) después del tratamiento, el ANOVA de Kruskal-Wallis (o cualquier otro algoritmo similar) afirmaría que no hay un cambio significativo en los niveles de hierro.

En mi humilde opinión, sin el grupo de control, lo mejor que puede hacer es contar cuántos pacientes aumentaron su nivel de hierro y cuántos lo disminuyeron, y probar la importancia de esto.

Dicho esto, si el KW ANOVA le dice que hay un nivel significativo de hierro, lo es (sin falsos positivos).

usuario31264
fuente

Yay por no falsos positivos! Jaja, gracias por tu respuesta. ¿Cómo sugiere que "analicemos la importancia de esto" en lo que respecta a contar cuántos pacientes aumentaron su nivel de hierro y cuántos lo disminuyeron? ¡Gracias!

Matt Reichenbach

Si hay

m

$m$

n

$n$

p = 2^{- (m + n)} \sum_{k = 0}^{m} (\binom{m + n}{k})

$p = 2^{-(m+n)} \sum_{k=0}^m {m+n \choose k}$

¡Gracias! Esta fue otra forma interesante de ver mi pregunta y veré cómo se aplica a mis datos.

msturm17