¿Puedo incluir un tamaño de efecto como una variable independiente en una meta-regresión?

11

Mi pregunta es si puedo usar un tamaño de efecto como variable dependiente y otro tamaño de efecto como variable independiente en una meta-regresión.XY

Por ejemplo, realicé un metanálisis de los efectos del ejercicio en los problemas con la bebida y encontré resultados significativos y una alta heterogeneidad. Quiero hacer una meta-regresión y usar el tamaño del efecto de esas intervenciones en la ansiedad como una variable independiente y el tamaño del efecto de los problemas con la bebida como una variable dependiente (suponiendo que cada estudio evaluó tanto la ansiedad como los problemas con la bebida y calculé el efecto tamaños como Hedges's ).g

¿Tiene sentido esto para ti?

Spyros
fuente
Mi única preocupación sería si necesitaría transformar el tamaño del efecto antes de la regresión ... similar a transformar r usando la transformación z de Fisher.
ReliableResearch

Respuestas:

13

Responder esta (buena) pregunta de manera responsable probablemente requiera abordar temas de metanálisis más allá de la metarregresión convencional. He encontrado este problema en los metanálisis de los clientes de consultoría, pero aún no he encontrado o desarrollado una solución satisfactoria, por lo que esta respuesta no es definitiva. A continuación menciono cinco ideas relevantes con citas de referencia seleccionadas.

Primero, presentaré terminología y notación para aclaración. Supongo que tiene datos emparejados de tamaño del efecto (ES) de estudios independientes, como las estimaciones de ES del estudio para problemas de bebida (DP) y para ansiedad, , así como la varianza condicional / de muestreo de cada estimación (es decir, error estándar al cuadrado), digamos y . Denotemos los dos parámetros de ES del Estudio (es decir, ES de muestra verdadera o infinita) como yi y D i y A i i = 1 , 2 , , k v D i v A i i θ D i θ A i μ D = E ( θ D i ) τ 2 D = V a r ( θ D i ) μ A = E ( θ A i ) τkiyDiyAii=1,2,,kvDivAiiθDiθAi. Tomando la visión tradicional de los efectos aleatorios de que estos parámetros de ES varían aleatoriamente entre los estudios, podríamos denotar sus medias y variaciones entre estudios como y para DP y como y para la ansiedad. En un metanálisis convencional para cada DP y ansiedad por separado (p. Ej., Con precisiones como pesos), podríamos suponer que la distribución de muestreo de cada estimación de ES es normal con una varianza conocida, es decir, y conμD=E(θDi)τD2=Var(θDi)μA=E(θAi)yDi| θDiN(θDi,vDi)yAi| θAiN(θAi,vAi)vDivAiτA2=Var(θAi)yDi|θDiN(θDi,vDi)yAi|θAiN(θAi,vAi)vDiy conocido, al menos para muestras grandes dentro del estudio.vAi

No necesariamente necesitamos tener una visión de los efectos aleatorios de este problema, pero debemos permitir que tanto como varíen entre los estudios para que las preguntas sobre su asociación tengan sentido. También podríamos hacer esto en un marco heterogéneo de efectos fijos, si tenemos cuidado con los procedimientos y la interpretación (por ejemplo, Bonett, 2009). Además, no sé si sus ES son correlaciones, diferencias de medias (estandarizadas), razones de probabilidad (log) u otra medida, pero la métrica de ES no importa mucho para la mayoría de lo que digo a continuación. θ A iθDiθAi

Ahora, a las cinco ideas.

1. Sesgo ecológico: evaluar una asociación entre sus dos ES aborda una pregunta a nivel de estudio , no a nivel de asignaturapregunta. He visto a metaanalistas interpretar inapropiadamente una asociación positiva entre dos ES como la suya de la siguiente manera: los sujetos para quienes la intervención disminuye la ansiedad más tienden a disminuir más en la DP. Los análisis de datos de ES a nivel de estudio no admiten declaraciones como esa; esto tiene que ver con el sesgo ecológico o la falacia ecológica (por ejemplo, Berlin et al., 2002; McIntosh, 1996). Por cierto, si tuvo datos individuales de pacientes / participantes (IPD) de los estudios o ciertas estimaciones de muestras adicionales (por ejemplo, la correlación de cada grupo entre ansiedad y DP), entonces podría abordar ciertas preguntas a nivel de sujeto sobre moderación o mediación que involucran la intervención, ansiedad y DP, como el efecto de la intervención sobre la asociación ansiedad-DP, o el efecto indirecto de la intervención sobre DP a través de la ansiedad (p. ej., intervención ansiedad DP).

2. Problemas de meta-regresión: aunque podría retroceder en utilizando un procedimiento de meta-regresión convencional que trata como una covariable / regresor / predictor fijo, conocido, probablemente no sea del todo apropiado. Para comprender los posibles problemas con esto, considere lo que podríamos hacer si fuera posible: Regrese on utilizando la regresión ordinaria (por ejemplo, OLS) para estimar o probar si o cómo significa covarios con . Si tuviéramos cada estudio , entonces usamos la meta-regresión convencional para hacer una regresión en y A i y A iyDiyAiyAiθDiθAiθDiθAiθAiyDiθAi nos daría lo que queremos, porque el modelo (simple) entre estudios es , donde es un error aleatorio. Sin embargo, al usar el mismo enfoque para regresar en , se ignoran dos problemas: difiere de debido a un error de muestreo (p. Ej., Cuantificado por ) y tiene un correlación dentro del estudio con debido a la correlación a nivel de sujeto entre ansiedad y DP. Sospecho que uno o ambos problemas distorsionarían la estimación de asociación entre yθDi=β0+β1θAi+uiuiyDiyAiyAiθAivAiyDiθDiθAi, como debido a la dilución de regresión / sesgo de atenuación.

3. Riesgo de referencia:Varios autores han abordado problemas análogos a los del n. ° 2 para los metanálisis del efecto de una intervención en un resultado binario. En tales metanálisis, a menudo existe la preocupación de que el efecto del tratamiento covaríe con la probabilidad o tasa del resultado en una población no tratada (p. Ej., Un efecto mayor para los sujetos con mayor riesgo). Es tentador utilizar la metarregresión convencional para predecir el efecto del tratamiento a partir del riesgo o la tasa de eventos de un grupo de control, ya que este último representa el riesgo subyacente / población / línea de base. Sin embargo, varios autores han demostrado limitaciones de esta estrategia simple o técnicas alternativas propuestas (por ejemplo, Dohoo et al., 2007; Ghidey et al., 2007; Schmid et al., 1998). Algunas de esas técnicas pueden ser adecuadas o adaptables a su situación con dos ES de punto final múltiple.

4. Metanálisis bivariado: puede tratar esto como un problema bivariado, donde el par del Estudio es una estimación de con matriz de covarianza condicional aquí las comas separan las columnas y un punto y coma separa las filas. Podríamos, en principio, utilizar un metanálisis de efectos aleatorios bivariados para estimar y la matriz de componentes de covarianza entre estudios . Esto podría hacerse incluso si algunos estudios contribuyen solo o soloiyi=[yDi,yAi]θi=[θDi,θAi]Vi=[vDi,vDAi;vADi,vAi]μ=[μD,μA]vADiT=[τD2,τDA;τAD,τA2]yDiyAi(p. ej., Jackson et al., 2010; White, 2011). Además de , también puede estimar otras medidas de la asociación entre ansiedad y DP como funciones de y , como la correlación entre y , o la pendiente de regresión -on- . Sin embargo, no estoy seguro de cuál es la mejor manera de hacer inferencias sobre cualquier medida de la asociación ansiedad-DP: ¿ y como aleatorio, o es mejor tratado como se solucionó (como podríamos si regresamos enτDA=τADμTθDiθAiθDiθAiθDiθAiθAiθDiθAi ), y ¿qué procedimientos son mejores para las pruebas, los intervalos de confianza u otros resultados inferenciales (p. ej., método delta, bootstrap, probabilidad de perfil)? Lamentablemente, calcular la covarianza condicional puede ser difícil, porque depende de la asociación rara vez reportada dentro del grupo entre ansiedad y DP; No abordaré aquí las estrategias para manejar esto (por ejemplo, Riley et al., 2010).vDAi=vADi

5. SEM para el metanálisis: parte del trabajo de Mike Cheung en la formulación de modelos metaanalíticos como modelos de ecuaciones estructurales (SEM) podría ofrecer una solución. Ha propuesto formas de implementar una amplia variedad de modelos de metanálisis de efectos fijos, aleatorios y mixtos uni y multivariados utilizando el software SEM, y proporciona software para esto:

http://courses.nus.edu.sg/course/psycwlm/internet/metaSEM/index.html

En particular, Cheung (2009) incluyó un ejemplo en el que un ES se trata como un mediador entre una covariable a nivel de estudio y otro ES, que es más complejo que su situación de predecir un ES con otro.

Referencias

Berlín, JA, Santanna, J., Schmid, CH, Szczech, LA, y Feldman, HI (2002). Metarregresiones de datos individuales a nivel de paciente versus grupo para la investigación de modificadores del efecto del tratamiento: el sesgo ecológico levanta su cabeza fea. Estadísticas en medicina, 21, 371-387. doi: 10.1002 / sim.1023

Bonett, DG (2009). Estimación del intervalo metaanalítico para diferencias de medias estandarizadas y no estandarizadas. Métodos psicológicos, 14, 225–238. doi: 10.1037 / a0016619

Cheung, MW-L. (2009, mayo). Modelado de tamaños de efectos multivariados con modelos de ecuaciones estructurales. En AR Hafdahl (Presidente), Avances en el metanálisis para modelos lineales multivariables. Simposio invitado presentado en la reunión de la Asociación de Ciencias Psicológicas, San Francisco, CA.

Dohoo, I., Stryhn, H. y Sanchez, J. (2007). Evaluación del riesgo subyacente como fuente de heterogeneidad en los metanálisis: un estudio de simulación de implementaciones bayesianas y frecuentistas de tres modelos. Medicina Veterinaria Preventiva, 81, 38-55. doi: 10.1016 / j.prevetmed.2007.04.010

Ghidey, W., Lesaffre, E. y Stijnen, T. (2007). Modelado semiparamétrico de la distribución del riesgo basal en el metanálisis. Estadísticas en medicina, 26, 5434-5444. doi: 10.1002 / sim.3066

Jackson, D., White, IR y Thompson, SG (2010). Ampliación de la metodología de DerSimonian y Laird para realizar metanálisis de efectos aleatorios multivariados. Estadísticas en medicina, 29, 1282-1297. doi: 10.1002 / sim.3602

McIntosh, MW (1996). Control de un parámetro ecológico en metaanálisis y modelos jerárquicos (tesis doctoral). Disponible en la base de datos de Tesis y Tesis de ProQuest. (UMI No. 9631547)

Riley, RD, Thompson, JR y Abrams, KR (2008). Un modelo alternativo para el metanálisis de efectos aleatorios bivariados cuando se desconocen las correlaciones dentro del estudio. Bioestadística, 9, 172-186. doi: 10.1093 / bioestadística / kxm023

Schmid, CH, Lau, J., McIntosh, MW, y Cappelleri, JC (1998). Un estudio empírico del efecto de la tasa de control como predictor de la eficacia del tratamiento en el metanálisis de ensayos clínicos. Estadísticas en medicina, 17, 1923-1942. doi: 10.1002 / (SICI) 1097-0258 (19980915) 17:17 <1923 :: AID-SIM874> 3.0.CO; 2-6

White, IR (2011). Metarregresión multivariada de efectos aleatorios: actualizaciones de mvmeta. Stata Journal, 11, 255-270.

Adam Hafdahl
fuente
11

Basado en las respuestas de Adam, tengo algunas elaboraciones. Primero y más importante, no es fácil conceptualizar teorías sustantivas sobre cómo y por qué un tamaño de efecto predice otro tamaño de efecto. Un metanálisis multivariado suele ser suficiente para explicar la asociación entre los tamaños del efecto. Si está interesado en hipotetizar direcciones entre los tamaños de los efectos, puede interesarle el trabajo de William Shadish (Shadish, 1992, 1996; Shadish & Sweeney, 1991).

Como Adam ha mencionado, hay algunos problemas al aplicar la meta-regresión entre los tamaños de los efectos. El principal problema es que los tamaños de los efectos se distribuyen condicionalmente con variaciones conocidas (y covarianzas). Se puede utilizar un enfoque de modelado de ecuaciones estructurales (SEM) para abordar este problema (Cheung, 2008, 2013, en prensa). Podemos formular los tamaños de efecto "verdaderos", y en la notación de Adam, como variables latentes. Los tamaños de efectos observados son indicadores de los tamaños de efectos "verdaderos":θDiθAi

yDi=θDi+eDi con yVar(eDi)=vDi

yAi=θAi+eAi con .Var(eAi)=vAi

Una vez que hemos formulado esta parte (el llamado modelo de medición), se puede ajustar fácilmente un modelo estructural entre los tamaños de efecto "verdaderos":

θDi=β0+β1θAi+uDi ,

donde es la heterogeneidad residual de y es la varianza de .Var(uDi)=τDi2θDiVar(θAi)=τAi2θAi

Como e están correlacionadas condicionalmente con un valor de , el último paso es incluir esta covarianza condicional en el modelo. El modelo propuesto es:yDiyAivDAimodelo propuesto

Usando la notación SEM convencional, los círculos y los cuadrados representan las variables latentes y observadas. El triángulo representa la intersección (o la media).

Dado que las variaciones y covarianzas de muestreo se conocen en un metanálisis, la mayoría de los paquetes SEM no se pueden usar para ajustarse a este modelo. Utilizo el paquete OpenMx implementado en R para ajustar este modelo. Si desea utilizar Mplus, debe hacer algunos trucos para manejar las variaciones y covarianzas de muestreo conocidas (consulte Cheung, en press_a para ver un ejemplo).

El siguiente ejemplo muestra cómo ajustar el modelo con "lifecon" como predictor y "lifeesat" como las variables dependientes en R. Sus variables latentes correspondientes se denominan "latcon" y "latsat". El conjunto de datos está disponible en el paquete metaSEM http://courses.nus.edu.sg/course/psycwlm/Internet/metaSEM/

## Load the library with the data set  
library(metaSEM)
## OpenMx is loaded automatically after loading metaSEM
## library(OpenMx)

## Select the sample effect sizes and their sampling covariance matrix
my.df <- wvs94a[, 2:6]

## It uses the reticular action model (RAM) specification
## A matrix specifies the asymmetric paths (regression coefficients and factor loadings)
## S matrix specifies the symmetric covariances and variances
## F matrix specifies a selection matrix to select the observed variables   
lat <- mxModel("LifesatOnLifeCon",
               mxData(observed=my.df, type="raw"),
               mxMatrix(type="Full", nrow=4, ncol=4,
                        free=c(F, T, rep(F, 14)),
                        values=c(0, 0.1, 1, rep(0,4), 1, rep(0,8)),
                        labels=c(NA, "beta1", rep(NA, 14)),
                        name="A"),
               mxMatrix(type="Symm", nrow=4, ncol=4,
                        values=0, free=c(T,rep(F,3),T,rep(F,5)),
                        labels=c("Var(LifeCon)",rep(NA,3),"Var(LifeSatError)",rep(NA,2),
                                 "data.lifecon_var", "data.inter_cov", "data.lifesat_var"),                        
                        name="S"),            
               mxMatrix(type="Full", nrow=2, ncol=4,
                        values=c(rep(0,4),1,0,0,1), name="F"),
               mxMatrix(type="Full", nrow=1, ncol=4, free=c(T, T, F, F),
                        values=c(0, 0, 0, 0), labels=c("MeanLifeCon", "beta0", NA, NA), name="M"),
               mxExpectationRAM("A", "S", "F", "M", dimnames=c("latcon", "latsat", "lifecon","lifesat")),
                                mxFitFunctionML())

summary(mxRun(lat))

El resultado es: Resumen de LifesatOnLifeCon

free parameters:
               name matrix row    col     Estimate   Std.Error
1             beta1      A   2      1  0.467619431 0.148202854
2      Var(LifeCon)      S   1      1  0.008413600 0.002537270
3 Var(LifeSatError)      S   2      2  0.002887461 0.001281026
4       MeanLifeCon      M   1 latcon  0.068825735 0.016819615
5             beta0      M   1 latsat -0.030834413 0.015565501

observed statistics:  84 
estimated parameters:  5 
degrees of freedom:  79 
-2 log likelihood:  -161.9216 
number of observations:  42 
Information Criteria: 
      |  df Penalty  |  Parameters Penalty  |  Sample-Size Adjusted
AIC:      -319.9216              -151.9216                       NA
BIC:      -457.1975              -143.2332                -158.8909
Some of your fit indices are missing.
  To get them, fit saturated and independence models, and include them with
  summary(yourModel, SaturatedLikelihood=..., IndependenceLikelihood=...). 
timestamp: 2015-01-20 18:56:09 
Wall clock time (HH:MM:SS.hh): 00:00:00.13 
optimizer:  NPSOL 
OpenMx version number: 2.0.0.4004 
Need help?  See help(mxSummary) 

Como nota final, el modelo anterior es equivalente al metanálisis bivariado al cambiar la ruta a una flecha doble representa la covarianza entre los tamaños del efecto "verdadero". El metanálisis bivariado puede realizarse mediante:τ 2 Dβ1τDA2

library(metaSEM)
summary( meta(y=cbind(lifesat, lifecon),
              v=cbind(lifesat_var, inter_cov, lifecon_var), 
              data=wvs94a) )

El resultado es:

Call:
meta(y = cbind(lifesat, lifecon), v = cbind(lifesat_var, inter_cov, 
    lifecon_var), data = wvs94a)

95% confidence intervals: z statistic approximation
Coefficients:
              Estimate   Std.Error      lbound      ubound z value  Pr(>|z|)
Intercept1  0.00134985  0.01385628 -0.02580797  0.02850766  0.0974 0.9223946
Intercept2  0.06882574  0.01681962  0.03585990  0.10179159  4.0920 4.277e-05
Tau2_1_1    0.00472726  0.00176156  0.00127465  0.00817986  2.6836 0.0072844
Tau2_2_1    0.00393437  0.00168706  0.00062779  0.00724094  2.3321 0.0196962
Tau2_2_2    0.00841361  0.00253727  0.00344064  0.01338657  3.3160 0.0009131

Intercept1    
Intercept2 ***
Tau2_1_1   ** 
Tau2_2_1   *  
Tau2_2_2   ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Q statistic on the homogeneity of effect sizes: 250.0303
Degrees of freedom of the Q statistic: 82
P value of the Q statistic: 0

Heterogeneity indices (based on the estimated Tau2):
                             Estimate
Intercept1: I2 (Q statistic)   0.6129
Intercept2: I2 (Q statistic)   0.7345

Number of studies (or clusters): 42
Number of observed statistics: 84
Number of estimated parameters: 5
Degrees of freedom: 79
-2 log likelihood: -161.9216 
OpenMx status1: 0 ("0" or "1": The optimization is considered fine.
Other values indicate problems.)

Cuando comparamos las probabilidades de log -2 de estos dos modelos, son exactamente iguales (-161.9216). En este caso, no obtenemos información adicional al ajustar una meta-regresión en los tamaños del efecto; un metanálisis bivariado ya es suficiente.

Referencias

Cheung, MW-L. (2008) Un modelo para integrar metanálisis de efectos fijos, aleatorios y mixtos en el modelado de ecuaciones estructurales . Métodos psicológicos , 13 (3), 182-202. doi: 10.1037 / a0013163

Cheung, MW-L. (2013) Metanálisis multivariante como modelos de ecuaciones estructurales . Modelado de ecuaciones estructurales: una revista multidisciplinaria , 20 (3), 429-454. doi: 10.1080 / 10705511.2013.797827

Cheung, MW-L. (2014) Modelado de tamaños de efectos dependientes con metaanálisis de tres niveles: un enfoque de modelado de ecuaciones estructurales . Métodos psicológicos , 19 (2), 211-29. doi: 10.1037 / a0032968.

Shadish, WR (1992). ¿Las psicoterapias familiares y maritales cambian lo que hacen las personas? Un metaanálisis de los resultados conductuales. En TD Cook, H. Cooper, DS Cordray, H. Hartmann, LV Hedges, RJ Light, TA Louis y F. Mosteller (Eds), Metaanálisis para explicación: un libro de casos (129-208). Nueva York: Russell Sage Foundation.

Shadish, WR (1996). Metaanálisis y exploración de procesos mediadores causales: una introducción de ejemplos, métodos y problemas. Métodos psicológicos , 1 , 47-65.

Shadish, WR y Sweeney, R. (1991). Mediadores y moderadores en el metanálisis: hay una razón por la que no dejamos que los pájaros dodo nos digan qué psicoterapias deberían tener premios. Revista de psicología clínica y consultoría , 59 , 883-893.

Mike Cheung
fuente
Bienvenido a nuestro sitio, Mike, y muchas gracias por hacer esta contribución.
whuber
Gracias, @Mike, por notar el importante trabajo de Shadish y elaborar mi punto # 5. Como sugiere, creo que su modelo estructural de 5 parámetros es equivalente a y en mi punto # 4 (por ejemplo, , ); interpretar y puede ser más fácil. Es interesante considerar otras estructuras de media y covarianza para y , especialmente con más parámetros de tamaño del efecto, pero interpretarlos en términos de fenómenos del mundo real puede ser un desafío. T β 1 = τ D A / τ 2 A β 0 = μ D - β 1 μ A β 0 β 1 μ TμTβ1=τDA/τA2β0=μDβ1μAβ0β1μT
Adam Hafdahl