Descripción del estudio:
He observado un error común entre los metanálisis, con respecto al manejo de la replicación dentro del estudio. No me queda claro si el error invalida los estudios cuando se establecen supuestos. Sin embargo, según tengo entendido, estos supuestos violan una premisa básica de las estadísticas.
Como ejemplo, un estudio pone a prueba los efectos de la sustancia química sobre la respuesta Y .
El análisis se realiza sobre la relación de respuesta logarítmica: la relación entre el tratamiento (en presencia de X ) y el control Y 0 (sin X ):
Algunos de los estudios incluidos en el meta-análisis contienen múltiples tratamientos, por ejemplo diferentes niveles o formas químicas de . Para cada tratamiento, hay un valor diferente de R , aunque R siempre usa el mismo valor de Y 0 .
Los métodos indican:
Preguntas:
- ¿No es esta pseudoreplicación?
- ¿Es inapropiado incluso si la violación de la independencia se declara en los métodos?
- ¿Cuál sería una manera fácil (por ejemplo, dentro de la capacidad de un paquete de software de metanálisis simple) de manejar dentro de la replicación del estudio?
Pensamientos iniciales
- Resumir los resultados de cada estudio, por ejemplo, tomando la respuesta promedio
- ¿Seleccionar solo un tratamiento de cada estudio según los criterios a priori (por ejemplo, la dosis más alta, la primera medición)?
¿Hay alguna otra solución?
fuente
Respuestas:
Sí, es un problema porque hay una dependencia de muestreo en las respuestas que debían tenerse en cuenta (aunque a veces el efecto puede ser insignificante y violamos el supuesto todo el tiempo cuando realizamos análisis estadísticos). Existen métodos para tratar esto, un enfoque es incluir las covarianzas entre los experimentos relacionados (bloques fuera de la diagonal) en la matriz de error varianza-covarianza (ver, por ejemplo, Hedges et al., 2010). Afortunadamente con las proporciones de registro esto es bastante fácil. Puede obtener covarianzas aproximadas entre experimentos porque la varianza (var) de log R es (si Yx e Y0 son grupos independientes): log Yx - log Y0, para seguir la notación en la pregunta, Yx se refiere al grupo experimental y Y0 el grupo de control. La covarianza (cov) entre dos valores (p. Ej., Tratamiento 1 och tratamiento 2) para log R es cov (loge Yx_1 - log Y0, log Yx_2 - log Y0), que es igual a var (log Y0), y se calcula como SD_Y0 / (n_Y0 * Y0), donde SD_Y0 es la desviación estándar de Y0, n_Y0 es el tamaño de la muestra en el tratamiento de control, y Y0 es El valor en el tratamiento de control. Ahora podemos conectar toda la matriz de varianza-covarianza en nuestro modelo en lugar de usar solo las varianzas (ei), que es la forma clásica de realizar un metanálisis. Un ejemplo de esto se puede encontrar enLimpens y col. 2011 usando el paquete metahdep en R (en bioconductor), o Stevens y Taylor 2009 para Hedge´s D.
Si desea que sea muy simple, estaría tentado a ignorar el problema y tratar de evaluar el efecto de la dependencia del muestreo (por ejemplo, ¿cuántos tratamientos hay dentro de los estudios? ¿Cómo cambian los resultados si solo uso un tratamiento? Etc.) .
fuente
Sí, esto es un problema.
Sí, es inapropiado aunque al menos sea transparente sobre lo que está haciendo (obtiene puntos por transparencia, pero aún así no es satisfactorio).
Dudo que haya una "manera fácil" de arreglar esto. No sé mucho sobre los enfoques adoptados para el metanálisis, pero si hay un software de metanálisis específico y se produce una investigación como esta que se utiliza y se publica, este puede ser el enfoque común. Cualquiera de las respuestas propuestas pierde cierta granularidad de información de cada estudio (es decir, el problema opuesto de lo que han hecho los editores).
La solución obvia es un modelo de efectos mixtos (es decir, multinivel) con estudio como factor aleatorio. Sugeriría usar un paquete estadístico especializado para esto si el software de metanálisis no puede hacerlo. Todavía podría usar el software de metanálisis para el almacenamiento y procesamiento de datos, y simplemente exportar datos a R, Stata o SAS para el análisis.
fuente