Diferencia entre Cohen's d y Hedges 'g para las medidas del tamaño del efecto

19

Para un análisis del tamaño del efecto, me doy cuenta de que hay diferencias entre la d de Cohen, la g de Hedges y la g * de Hedges.

  • ¿Son estas tres métricas normalmente muy similares?
  • ¿Cuál sería un caso en el que producirían resultados diferentes?
  • ¿También es una cuestión de preferencia con la que uso o informo?
Elpezmuerto
fuente
1
En caso de que sea útil para un posible respondedor, las fórmulas se enumeran aquí: en.wikipedia.org/wiki/Effect_size
Jeromy Anglim
Una simulación en R con n1, n2, s1, s2 y diferencia de población variables sería un buen ejercicio. ¿Nadie?
Jeromy Anglim
1
Este material también se trata aquí: ¿Cuál es la diferencia entre Hedges 'g y Cohen's d .
gung - Restablece a Monica

Respuestas:

18

Tanto Cohen's d como Hedges 'g agrupan las variaciones bajo el supuesto de variaciones de población iguales, pero g agrupa usando n - 1 para cada muestra en lugar de n, lo que proporciona una mejor estimación, especialmente cuanto más pequeños son los tamaños de muestra. Tanto d como g están sesgados de manera positiva, pero solo de forma insignificante para tamaños de muestra moderados o más grandes. El sesgo se reduce con g *. La d de Glass no asume variaciones iguales, por lo que utiliza la sd de un grupo de control o grupo de comparación de referencia como el estandarizador para la diferencia entre las dos medias.

Estos tamaños de efectos y Cliff's y otros tamaños de efectos no paramétricos se analizan en detalle en mi libro:

Grissom, RJ y Kim, J, J. (2005). Tamaños de efectos para la investigación: un enfoque práctico amplio. Mahwah, Nueva Jersey: Erlbaum.

Robert J. Grissom
fuente
8

Según tengo entendido, la g de Hedges es una versión algo más precisa de la d de Cohen (con SD agrupada) ya que agregamos un factor de corrección para una muestra pequeña. Ambas medidas generalmente están de acuerdo cuando no se viola el supuesto de homocedasticidad, pero podemos encontrar situaciones en las que este no es el caso, ver, por ejemplo, McGrath & Meyer, Psychological Methods 2006, 11 (4) : 386-401 ( pdf ). Otros documentos se enumeran al final de mi respuesta.

En general, encontré que en casi todos los estudios psicológicos o biomédicos, este es el d de Cohen que se informa; Esto probablemente se basa en la conocida regla general para interpretar su magnitud (Cohen, 1988). No conozco ningún artículo reciente que considere la g de Hedges (o Cliff delta como una alternativa no paramétrica). Bruce Thompson tiene una versión revisada de la sección APA sobre el tamaño del efecto.

Buscando en Google los estudios de Monte Carlo sobre las medidas del tamaño del efecto, encontré este artículo que podría ser interesante (solo leí el resumen y la configuración de la simulación): Intervalos de confianza robustos para los tamaños del efecto: un estudio comparativo de Cohen's d y Cliff's Delta Under Non-normality y variaciones heterogéneas (pdf).

Acerca de su segundo comentario, el MBESSpaquete R incluye varias utilidades para el cálculo de ES (por ejemplo, smdy funciones relacionadas).

otras referencias

  1. Zakzanis, KK (2001). Estadísticas para decir la verdad, toda la verdad y nada más que la verdad: fórmulas, ejemplos numéricos ilustrativos e interpretación heurística de análisis de tamaño de efecto para investigadores neuropsicológicos. Archives of Clinical Neuropsychology , 16 (7), 653-667. ( pdf )
  2. Durlak, JA (2009). Cómo seleccionar, calcular e interpretar los tamaños del efecto. Revista de Psicología Pediátrica ( pdf )
chl
fuente
2
Un usuario anónimo quería agregar la siguiente definición de homocedasticidad para aquellos que podrían no estar familiarizados con el término: "una propiedad de un conjunto de variables aleatorias donde cada variable tiene la misma varianza finita".
gung - Restablece a Monica
5

Parece que cuando la gente dice que Cohen d quiere decir en su mayoría:

re=X¯1-X¯2s

Donde es la desviación estándar agrupada,s

s=(X1-X¯1)2+(X2-X¯2)2norte1+norte2-2

Existen otros estimadores para la desviación estándar agrupada, probablemente el más común, aparte de lo anterior:

s=(X1-X¯1)2+(X2-X¯2)2norte1+norte2

La notación aquí es notablemente inconsistente, pero a veces la gente dice que la versión (es decir, la versión ) se llama Cohen's , y reserva el nombre Hedge's para la versión que usa (es decir, con la corrección de Bessel, la versión n1 + n2−2). Esto es un poco extraño ya que Cohen describió ambos estimadores para la desviación estándar agrupada (por ejemplo, versión de en la p. 67, Cohen, 1977) antes de que Hedges escribiera sobre ellos (Hedges, 1981).snorte1+norte2resolss

Otras veces, la g de Hedge se reserva para referirse a cualquiera de las versiones con corrección de sesgo de una diferencia de medias estandarizada que desarrolló Hedges. Hedges (1981) mostró que la d de Cohen estaba sesgada hacia arriba (es decir, su valor esperado es mayor que el valor del parámetro de población real), especialmente en muestras pequeñas, y propuso un factor de corrección para corregir la tendencia de d de Cohen:

La cobertura de g (el estimador imparcial):

sol=re(Γ(reF/ /2)reF/ /2Γ((reF-1)/ /2))
Donde para un diseño de grupos independientes, y es la función gamma. (originalmente Hedges 1981, esta versión se desarrolló a partir de Hedges y Olkin 1985, p. 104)reF=norte1+norte2-2Γ

Sin embargo, este factor de corrección es bastante complejo computacionalmente, por lo que Hedges también proporcionó una aproximación trivial computacional que, aunque todavía está ligeramente sesgada, está bien para casi todos los propósitos concebibles:

Coberturas ' (la aproximación computacionalmente trivial):sol

sol=re(1-34 4(reF)-1)
Donde para un diseño de grupos independientes.reF=norte1+norte2-2

(Originalmente de Hedges, 1981, esta versión de Borenstein, Hedges, Higgins y Rothstein, 2011, p. 27)

Pero, en cuanto a lo que la gente quiere decir cuando dice que d de Cohen vs. g de ged g * g, las personas parecen referirse a cualquiera de estos tres estimadores como Hedge g o Cohen d intercambiablemente, aunque nunca he visto a alguien escribir " "en un documento de investigación no metodológico / estadístico. Si alguien dice "d de Cohen imparcial", solo tendrás que adivinar lo mejor de cualquiera de las dos últimas (¡y creo que incluso podría haber otra aproximación que se haya utilizado para Hedge también!).solsol

Todos son prácticamente idénticos si o menos, y todos pueden interpretarse de la misma manera. A todos los efectos prácticos, a menos que se trate de tamaños de muestra realmente pequeños, probablemente no importa cuál use (aunque si puede elegir, también puede usar el que he llamado Hedges 'g, ya que es imparcial).norte>20

Referencias

Borenstein, M., Hedges, LV, Higgins, JP y Rothstein, HR (2011). Introducción al metanálisis. West Sussex, Reino Unido: John Wiley & Sons.

Cohen, J. (1977). Análisis estadístico del poder de las ciencias del comportamiento (2ª ed.). Hillsdale, NJ, EE. UU .: Lawrence Erlbaum Associates, Inc.

Coberturas, LV (1981). Teoría de la distribución para el estimador de Glass del tamaño del efecto y estimadores relacionados Revista de Estadísticas Educativas, 6 (2), 107-128. doi: 10.3102 / 10769986006002107

Coberturas LV, Olkin I. (1985). Métodos estadísticos para el metanálisis. San Diego, CA: Academic Press

FelixST
fuente
3

Si solo está tratando de comprender el significado básico de Hedges 'g, como soy yo, también puede encontrar esto útil:

La magnitud de la cobertura de H se puede interpretar usando la convención de Cohen (1988 [2]) como pequeña (0.2), mediana (0.5) y grande (0.8). [1]

Su definición es corta y clara:

La cobertura g es una variación de la d de Cohen que corrige los sesgos debido a los tamaños de muestra pequeños (Hedges y Olkin, 1985). [1] nota al pie

Agradecería que los expertos en estadísticas editen esto para agregar cualquier advertencia importante al reclamo pequeño (0.2) mediano (0.5) y grande (0.8), para ayudar a los no expertos a evitar malinterpretar los números g de Hedges utilizados en la investigación en ciencias sociales y psicología.

[1] http://www.ncbi.nlm.nih.gov/pmc/articles/PMC2848393/ El efecto de la terapia basada en la atención plena sobre la ansiedad y la depresión: una revisión metaanalítica Stefan G. Hofmann, Alice T. Sawyer, Ashley A. Witt y Diana Oh. J Consulte Clin Psychol. Abril de 2010; 78 (2): 169-183. doi: 10.1037 / a0018555

[2] Cohen J. Análisis de poder estadístico para las ciencias del comportamiento. 2da ed. Erlbaum; Hillsdale, NJ: 1988 (citado en [1])

joshoff
fuente
44
+1. Re: pequeño-mediano-grande, como un primer pase, si no tiene ningún conocimiento o contexto relevante, estos 'tamaños de camiseta' están bien, pero en realidad, lo que es un efecto pequeño o grande variará según la disciplina o el tema . Además, el hecho de que un efecto sea "grande" no significa necesariamente que sea prácticamente importante o teóricamente significativo.
gung - Restablece a Monica
1

Los otros carteles han cubierto el tema de las similitudes y diferencias entre gyd. Solo para agregar a esto, algunos académicos sienten que los valores de tamaño del efecto ofrecidos por Cohen son demasiado generosos y conducen a una interpretación excesiva de los efectos débiles. Tampoco están vinculados a r, lo que lleva a la posibilidad de que los académicos se conviertan de un lado a otro para obtener tamaños de efectos interpretables más favorablemente. Ferguson (2009, Professional Psychology: Research and PRactice) sugirió utilizar los siguientes valores para la interpretación de g:

.41, como mínimo recomendado para "importancia práctica". 1.15, efecto moderado 2.70, efecto fuerte

Obviamente, estos son más rigurosos / difíciles de lograr y no muchos experimentos de ciencias sociales van a tener efectos fuertes ... que probablemente sea así.

Viaje en el tiempo
fuente
0

Bruce Thompson advirtió sobre el uso de Cohen (0.2) como pequeño (0.5) como mediano y (0.8) como grande. Cohen nunca quiso que se usaran como interpretaciones rígidas. Todos los tamaños de efectos deben interpretarse según el contexto de la literatura relacionada. Si está analizando los tamaños de efectos relacionados informados sobre su tema y son (0.1) (0.3) (0.24) y produce un efecto de (0.4), entonces eso puede ser "grande". Por el contrario, si toda la literatura relacionada tiene efectos de (0.5) (0.6) (0.7) y usted tiene el efecto de (0.4), puede considerarse pequeño. Sé que este es un ejemplo trivial pero imperativamente importante. Creo que Thompson dijo una vez en un artículo: "Seríamos simplemente estúpidos en una métrica diferente" al comparar las interpretaciones de los tamaños del efecto con la forma en que los científicos sociales interpretaban los valores p en ese momento.

usuario136666
fuente