Cálculo del tamaño de muestra para modelos mixtos

23

Me pregunto si hay algún método para calcular el tamaño de la muestra en modelos mixtos. Estoy usando lmerR para ajustar los modelos (tengo pendientes e intercepciones aleatorias).

Nikita Kuznetsov
fuente
3
La simulación es siempre una opción, es decir, simular datos bajo una hipótesis alternativa particular y tamaño de muestra y volver a ajustar el modelo muchas veces para ver con qué frecuencia rechaza la hipótesis nula de interés. Desde mi experiencia, esto consume bastante tiempo (de la computadora) ya que toma al menos unos segundos para cada ajuste del modelo.
Macro

Respuestas:

29

El longpowerpaquete implementa los cálculos del tamaño de la muestra en Liu y Liang (1997) y Diggle et al (2002). La documentación tiene un código de ejemplo. Aquí hay uno, usando la lmmpower()función:

> require(longpower)
> require(lme4)
> fm1 <- lmer(Reaction ~ Days + (Days|Subject), sleepstudy) 
> lmmpower(fm1, pct.change = 0.30, t = seq(0,9,1), power = 0.80)

     Power for longitudinal linear model with random slope (Edland, 2009) 

              n = 68.46972
          delta = 3.140186
         sig2.s = 35.07153
         sig2.e = 654.941
      sig.level = 0.05
              t = 0, 1, 2, 3, 4, 5, 6, 7, 8, 9
          power = 0.8
    alternative = two.sided
       delta.CI = 2.231288, 4.049084
           Days = 10.46729
        Days CI = 7.437625, 13.496947
           n.CI = 41.18089, 135.61202

Compruebe también liu.liang.linear.power()que " realiza el cálculo del tamaño de muestra para un modelo mixto lineal"

Liu, G. y Liang, KY (1997). Cálculos de tamaño de muestra para estudios con observaciones correlacionadas. Biometrics, 53 (3), 937-47.

Diggle PJ, Heagerty PJ, Liang K, Zeger SL. Análisis de datos longitudinales. Segunda edicion. Oxford Ciencia Estadística Serires. 2002

Editar: Otra forma es "corregir" el efecto de la agrupación. En un modelo lineal ordinario, cada observación es independiente, pero en presencia de agrupamiento, las observaciones no son independientes, lo que puede considerarse como tener menos observaciones independientes: el tamaño efectivo de la muestra es menor. Esta pérdida de efectividad se conoce como el efecto de diseño :

remi=1+(metro-1)ρ
donde es el tamaño promedio del clúster y es el coeficiente de correlación intraclase (coeficiente de partición de varianza). Entonces, el tamaño de muestra obtenido a través de un cálculo que ignora la agrupación es inflado por para obtener un tamaño de muestra que permita la agrupación.metroρremi
Robert Long
fuente
3
remiFF=1+(metro-1)ρXρϵ,
ρXρϵ
¿Me puede señalar una cita para esta fórmula?
Joshua Rosenberg
10

Para cualquier cosa más allá de las simples pruebas de 2 muestras, prefiero usar la simulación para el tamaño de la muestra o los estudios de potencia. Con las rutinas preempaquetadas, a veces puede ver grandes diferencias entre los resultados de los programas en función de los supuestos que están haciendo (y es posible que no pueda descubrir cuáles son esos supuestos, y mucho menos si son razonables para su estudio). Con la simulación, controlas todos los supuestos.

Aquí hay un enlace a un ejemplo:
https://stat.ethz.ch/pipermail/r-sig-mixed-models/2009q1/001790.html

Greg Snow
fuente
Solo me pregunto, ¿esto también funciona para los modelos GLMER?
Charlie Glez
1
@CarlosGlez, sí, esto funciona para cualquier modelo en el que pueda simular datos y analizarlos. He hecho esto para los modelos GLMER.
Greg Snow
Bien dicho, y agregaré que además de "supuestos de control", también puede hacer preguntas de "qué pasaría si", romper estos supuestos y determinar algún sentido práctico de robustez, por ejemplo, si los efectos aleatorios no normales realmente arruinan la eficiencia.
AdamO