Calcular tamaños de efectos y errores estándar para la diferencia entre dos diferencias de medias estandarizadas

8

Tengo dos preguntas relacionadas, ambas relacionadas con un metanálisis que estoy realizando donde los resultados primarios se expresan en términos de la diferencia de medias estandarizada.

Mis estudios tienen múltiples variables disponibles para calcular la diferencia de medias estandarizada. Me gustaría saber hasta qué punto las diferencias de medias estandarizadas calculadas en una variable son consistentes con las diferencias de medias estandarizadas en la otra. En mi opinión, esta pregunta podría expresarse como un metanálisis sobre la diferencia entre dos conjuntos de diferencias de medias estandarizadas. Sin embargo, tengo problemas para determinar el tamaño del efecto y el error de muestreo para la diferencia entre dos diferencias de medias estandarizadas dentro del mismo estudio.

Para expresar mi problema de una manera diferente, considere un estudio de dos condiciones con los grupos y y las variables de resultado y . Estas dos variables de resultado están correlacionadas como . Podemos calcular las diferencias de medias estandarizadas para y en y , produciendo , y sus variaciones de muestreo y . He incluido un esquema muy simple de la situación a continuación.g1g2var1var2cor(var1,var2)var1var2g1g2dvar1dvar2vdvar1vdvar2

ingrese la descripción de la imagen aquí

Ahora digamos que calculamos una diferencia entre y como . Puedo calcular la diferencia de medias estandarizada entre y como , que tiene una varianza de muestreo .var1var2diffg1g2ddiffvrereyoFF

Lo que me gustaría hacer es expresar y en términos de las siguientes variables:rereyoFFvrereyoFF

  1. Tamaños de efectos y ,revunar1revunar2
  2. muestreo y , yvrevunar1vrevunar2
  3. correlaciónCor(vunar1,vunar2)

Creo que este objetivo debería ser posible dado el hecho de que, en un contexto simple (no metaanalítico), la desviación estándar de la diferencia entre y se da comovunar1vunar2

sre(vunar1)2+sre(vunar2)2-2Cor(vunar1,vunar2)sre(vunar1)sre(vunar2)


También estoy interesado en una situación un poco más complicada donde uno tiene estudios con 3 (o más) grupos, y donde uno calcula dos conjuntos de diferencias de medias estandarizadas entre las dos variables candidatas.

Para expresar esta segunda pregunta de una manera diferente, asumir que un determinado estudio tiene tres grupos , y y dos variables de resultado y . Además, suponga una vez más que y están correlacionados como .sol1sol2sol3vunar1vunar2vunar1vunar2Cor(vunar1,vunar2)

Elija el grupo como grupo de referencia y, para , calcule los tamaños de efecto para el grupo frente a y frente a . Esto producirá dos conjuntos de tamaños de efectos para cada uno de y : para , y y, para , y . Esto también generará dos variaciones de muestreo para cada conjunto de tamaños de efectos (para , ysol1vunar1sol1sol2sol1sol3vunar1vunar2vunar1revunar1sol1-sol2revunar1sol1-sol3vunar2revunar2sol1-sol2revunar2sol1-sol3vunar1vrevunar1sol1-sol2vrevunar1sol1-sol3 y, para , y ) y una covarianza de muestreo para cada variable (para , y, para , ). He incluido un esquema muy simple de la situación a continuación.vunar2vrevunar2sol1-sol2vrevunar2sol1-sol3vunar1Cov(revunar1sol1-sol2,revunar1sol1-sol3)vunar2Cov(revunar2sol1-sol2,revunar2sol1-sol3)

ingrese la descripción de la imagen aquí

Una vez más, puedo crear una puntuación de diferencia entre y , produciendo . Luego puedo calcular dos conjuntos de tamaños de efectos en este puntaje de diferencia como el anterior, calculando una diferencia de medias estandarizada para la comparación entre y (produciendo ) y una diferencia de medias estandarizada para la comparación entre y (dando . Este procedimiento, por supuesto, también producirá las variaciones y covarianzas de muestreo correspondientes.vunar1vunar2reyoFFsol1sol2rereyoFFsol1-sol2sol1sol3rereyoFFsol1-sol3)

Lo que me gustaría es expresar los tamaños del efecto, las variaciones de muestreo y las covarianzas de muestreo para en términos de:reyoFF

  1. Tamaños de efectos , , yrevunar1sol1-sol2revunar1sol1-sol3revunar2sol1-sol2revunar2sol1-sol3
  2. Muestreo de varianzas , , , y ,vrevunar1sol1-sol2vrevunar1sol1-sol3vrevunar2sol1-sol2vrevunar2sol1-sol3
  3. Muestreo de covarianzas y , yCov(revunar1sol1-sol2,revunar1sol1-sol3)Cov(revunar2sol1-sol2,revunar2sol1-sol3)
  4. correlaciónCor(vunar1,vunar2)

Una vez más, creo que mi objetivo debería ser factible dado el hecho de que es posible calcular la desviación estándar de una puntuación de diferencia entre y dado , y .vunar1vunar2sre(vunar1)sre(vunar2)Cor(vunar1,vunar2)

Me doy cuenta de que mis preguntas son un poco complicadas, pero siento que podrían responderse con un poco de álgebra inteligente. Avíseme si puedo aclarar mi pregunta y / o notación de alguna manera.

Patrick S. Forscher
fuente

Respuestas:

7

Ciertamente puedo darle una respuesta a la primera parte de su pregunta.

Usando su notación, deje que y denoten los dos valores d (calculados para los mismos dos grupos) basados ​​en dos variables dependientes diferentes y deje que y denoten las variaciones de muestreo correspondientes, que normalmente se calculan / estiman con: y donde y son los dos grupos Tamaños.revunar1revunar2vvunar1vvunar2

vvunar1=1norte1+1norte2+revunar122(norte1+norte2)
vvunar2=1norte1+1norte2+revunar222(norte1+norte2),
norte1norte2

Deje denotar la correlación entre las dos variables. Luego, la covarianza entre los dos valores d se puede estimar con:Ver la ecuación (19.27) en el capítulo sobre tamaños de efectos dependientes estocásticamente por Gleser y Olkin (2009) en El manual de síntesis de investigación y metaanálisis (2ª ed.).r=Cor(vunar1,vunar2)

Cov(revunar1,revunar2)=(1norte1+1norte2)r+(revunar1revunar22(norte1+norte2))r2.

Por lo tanto, la varianza de muestreo de se puede calcular / estimar con:

rereyoFF=revunar1-revunar2
vrereyoFF=vvunar1+vvunar2-2Cov(revunar1,revunar2).

El capítulo de Gleser y Olkin también aborda en parte su segunda pregunta. Esencialmente, tiene lo que los autores llaman un 'estudio de tratamiento múltiple' y también proporcionan ecuaciones para la covarianza en ese caso (ver Expectativa de variables correlacionadas ). Sin embargo, su caso es en realidad una combinación del caso de 'tratamiento múltiple' y 'punto final múltiple'. Derivar las ecuaciones de covarianza necesarias requeriría un trabajo adicional.

Wolfgang
fuente
1
¿Es también el caso de que es simplemente - , o esta cantidad también se ve afectada por ? ddiffdvar1dvar2cor(var1,var2)
Patrick S. Forscher
1
Sí, solo toma la diferencia. La correlación solo es relevante para calcular la varianza de muestreo de . rereyoFF
Wolfgang
1
¡Excelente! ¿Tiene, por casualidad, alguna idea de qué enfoque podría tomar para resolver mi segunda pregunta? Sé por Gleser y Olkin que la covarianza entre y es , pero no tengo claro cómo usar esta información para obtener la covarianza entre los dos tamaños de efectos para . resol1-sol2resol1-sol31/ /nortesol1+(resol1-sol2resol1-sol3)/ /(2(nortesol1+nortesol2+nortesol3))rereyoFF
Patrick S. Forscher
Si no conoce la solución completa, me encantaría tener una idea general de cómo investigaría este problema.
Patrick S. Forscher
1
Tendría que volver a la derivación de esas covarianzas y ver si puede generalizar / combinar los dos casos (grupos múltiples y puntos finales múltiples). En el apéndice de Rosenthal y Rubin (1986) se puede encontrar un breve bosquejo sobre cómo se puede derivar la covarianza para el caso de punto final múltiple . No conozco una referencia que cubra el caso de múltiples grupos.
Wolfgang
3

Esta pregunta puede responderse utilizando un enfoque de modelado de ecuaciones estructurales (SEM). Se puede usar siempre que los tamaños del efecto sean funciones de los parámetros, como medias, correlaciones y desviaciones estándar. La matriz de covarianza de muestreo se deriva numéricamente mediante el uso del método Delta automáticamente en SEM. El Capítulo 3 de Cheung (2015) proporciona una introducción y ejemplos en este enfoque.

Uno de los ejemplos utilizados en el libro es el tratamiento múltiple de estudios de punto final múltiple. Aquí están la sintaxis y la salida en R.

###################################################
### code chunk number 8: ME_MT
###################################################

## Load the library for SEM
library(lavaan)

## Covariance matrix of the control group for variables 1 and 2
lower <- '11          
          5, 10'
## Convert a lower triangle data into a covariance matrix
Cov1 <- getCov(lower, diag=TRUE, names=c("x1", "x2"))

## Covariance matrix of the treatment group 1 for variables 1 and 2
lower <- '12          
          6, 11'
Cov2 <- getCov(lower, diag=TRUE, names=c("x1", "x2"))

## Covariance matrix of the treatment group 2 for variables 1 and 2
lower <- '13          
          7, 12'
Cov3 <- getCov(lower, diag=TRUE, names=c("x1", "x2"))

## Convert covariance matrices into a list
Cov <- list(Cov1, Cov2, Cov3)

## Means for the three groups
## 10 and 11 are the means for variables 1 and 2
Mean <- list(c(10,11), c(12,13), c(13,14))

## Sample sizes for the groups
N <- c(50, 50, 50)

## Assuming homogeneity of covariance matrices
## You can free this constraint by using different labels
model5 <- 'eta1 =~ c("sd1", "sd1", "sd1")*x1
           eta2 =~ c("sd2", "sd2", "sd2")*x2
           eta1 ~~ c("r", "r", "r")*eta2
           ## The subscripts 0, 1 and 2 represent the means
           ##  of the control and two  treatment groups
           x1 ~ c("m1_0", "m1_1", "m1_2")*1
           x2 ~ c("m2_0", "m2_1", "m2_2")*1
           ## The measurement errors are fixed at 0
           x1 ~~ 0*x1
           x2 ~~ 0*x2
           ## Multiple endpoint effect size 1 for treatment group 1
           ES1_1 := (m1_1 - m1_0)/sd1
           ## Multiple endpoint effect size 2 for treatment group 1
           ES2_1 := (m2_1 - m2_0)/sd2
           ## Multiple endpoint effect size 1 for treatment group 2
           ES1_2 := (m1_2 - m1_0)/sd1
           ## Multiple endpoint effect size 2 for treatment group 2
           ES2_2 := (m2_2 - m2_0)/sd2'

fit5 <- sem(model5, sample.cov=Cov, sample.mean=Mean, 
            sample.nobs=N, std.lv=TRUE, 
            sample.cov.rescale=FALSE)

## Obtain the free parameters in the model
( x <- fit5@Fit@x )

## [1]  3.464102  3.316625  0.522233 10.000000 11.000000 12.000000 13.000000
## [8] 13.000000 14.000000    

## Obtain the sampling covariance matrix of the parameter estimates
VCOV <- vcov(fit5)

## Compute the multivariate effect sizes
( ES <- fit5@[email protected](x=x) )
##     ES1_1     ES2_1     ES1_2     ES2_2 
## 0.5773503 0.6030227 0.8660254 0.9045340

## Compute the jacobian for 'defined parameters'
JAC <- lavaan:::lavJacobianD(func=fit5@[email protected], x=x)

## Compute the sampling covariance matrix using delta method
ES.VCOV <- JAC %*% VCOV %*% t(JAC)

## Add the variable names for ease of reference
dimnames(ES.VCOV) <- list(names(ES), names(ES))

ES.VCOV
##            ES1_1      ES2_1      ES1_2      ES2_2
## ES1_1 0.04111111 0.02120582 0.02166667 0.01091942
## ES2_1 0.02120582 0.04121212 0.01091942 0.02181818
## ES1_2 0.02166667 0.01091942 0.04250000 0.02160145
## ES2_2 0.01091942 0.02181818 0.02160145 0.04272727

En este ejemplo, el vector estimado de los tamaños del efecto es su matriz de covarianza de muestreo son ES y ES.VCOV, respectivamente. ES1_1 y ES2_1 son los tamaños de efectos para el grupo 1 que se compara con el grupo de control, mientras que ES1_2 y ES2_2 son los tamaños de efectos del grupo 2 que se comparan con el grupo de control.

Referencia

Cheung, MW-L. (2015) Metaanálisis: un enfoque de modelado de ecuaciones estructurales . Chichester, West Sussex: John Wiley & Sons, Inc ..

Mike Cheung
fuente
¡Gracias por compartir este interesante enfoque! Cuando traté de ejecutar las siguientes líneas: ( ES <- fit5@[email protected](x=x) )y JAC <- lavaan:::lavJacobianD(func=fit5@[email protected], x=x)me dio un error que xno existe.
Patrick S. Forscher
Además, su ejemplo parece sugerir que, para que este método funcione, necesito saber la correlación / covarianza entre var1y var2dentro de g1, g2y g3. ¿Es este el caso? Por lo general, en los estudios con los que trabajo, sólo la correlación global (a través de colapso g1, g2y g3) se informa.
Patrick S. Forscher
Finalmente, este enfoque funciona en el caso de dos grupos donde no conozco las medias y las desviaciones estándar para y , pero puedo extraer directamente los tamaños de efecto y de, por ejemplo, t -pruebas reportadas en el trabajo en cuestión? vunar1vunar2revunar1revunar2
Patrick S. Forscher el
Gracias patricio. He agregado la línea que falta: (x <- fit5 @ Fit @ x). Dado que los tamaños de los efectos son funciones de medias, varianzas y covarianzas, este enfoque necesita estos elementos. Si algunos de estos elementos no están disponibles, es posible que necesite calcular otros enfoques ...
Mike Cheung
Hola Mike, espero que sigas siguiendo este hilo. Estaba interesado en su enfoque, así que intenté simular algunos datos de tres grupos con dos variables (código pegado en el comentario a continuación). Cuando comparé su enfoque con algunos cálculos manuales, obtuve tamaños de efectos idénticos pero diferentes errores de muestreo de los tamaños de efectos. Hasta donde puedo decir, estoy usando su código y las fórmulas correctas para las variaciones de muestreo. ¿Tienes idea de lo que está pasando?
Patrick S. Forscher
0

No estoy completamente seguro de cómo se derivó esta solución, pero pensé que la publicaría de todos modos para que otras personas pudieran evaluarla. También pensé que valía la pena publicar esta información como respuesta completa en lugar de dejarla oculta en los comentarios de la respuesta proporcionada por @Wolfgang.

De acuerdo con una respuesta que Ian White suministra en correspondencia con me, grupos dados , , y , y suponiendo que la desviación estándar utilizado para los tamaños del efecto de uno Calcular se agruparon en todos , , y ,sol1sol2sol3sol1sol2sol3

Cov(rereyoFFsol1-sol2,rereyoFFsol1-sol3)=rnorte1+rereyoFFsol1-sol2rereyoFFsol1-sol3r2(2(norte1+norte2+norte3))

Una vez más, no estoy completamente seguro de cómo se derivó esta solución, y agradecería cualquier idea que otros puedan proporcionar.

Patrick S. Forscher
fuente