Para un análisis del tamaño del efecto, me doy cuenta de que hay diferencias entre la d de Cohen, la g de Hedges y la g * de Hedges.
- ¿Son estas tres métricas normalmente muy similares?
- ¿Cuál sería un caso en el que producirían resultados diferentes?
- ¿También es una cuestión de preferencia con la que uso o informo?
effect-size
cohens-d
Elpezmuerto
fuente
fuente
Respuestas:
Tanto Cohen's d como Hedges 'g agrupan las variaciones bajo el supuesto de variaciones de población iguales, pero g agrupa usando n - 1 para cada muestra en lugar de n, lo que proporciona una mejor estimación, especialmente cuanto más pequeños son los tamaños de muestra. Tanto d como g están sesgados de manera positiva, pero solo de forma insignificante para tamaños de muestra moderados o más grandes. El sesgo se reduce con g *. La d de Glass no asume variaciones iguales, por lo que utiliza la sd de un grupo de control o grupo de comparación de referencia como el estandarizador para la diferencia entre las dos medias.
Estos tamaños de efectos y Cliff's y otros tamaños de efectos no paramétricos se analizan en detalle en mi libro:
Grissom, RJ y Kim, J, J. (2005). Tamaños de efectos para la investigación: un enfoque práctico amplio. Mahwah, Nueva Jersey: Erlbaum.
fuente
Según tengo entendido, la g de Hedges es una versión algo más precisa de la d de Cohen (con SD agrupada) ya que agregamos un factor de corrección para una muestra pequeña. Ambas medidas generalmente están de acuerdo cuando no se viola el supuesto de homocedasticidad, pero podemos encontrar situaciones en las que este no es el caso, ver, por ejemplo, McGrath & Meyer, Psychological Methods 2006, 11 (4) : 386-401 ( pdf ). Otros documentos se enumeran al final de mi respuesta.
En general, encontré que en casi todos los estudios psicológicos o biomédicos, este es el d de Cohen que se informa; Esto probablemente se basa en la conocida regla general para interpretar su magnitud (Cohen, 1988). No conozco ningún artículo reciente que considere la g de Hedges (o Cliff delta como una alternativa no paramétrica). Bruce Thompson tiene una versión revisada de la sección APA sobre el tamaño del efecto.
Buscando en Google los estudios de Monte Carlo sobre las medidas del tamaño del efecto, encontré este artículo que podría ser interesante (solo leí el resumen y la configuración de la simulación): Intervalos de confianza robustos para los tamaños del efecto: un estudio comparativo de Cohen's d y Cliff's Delta Under Non-normality y variaciones heterogéneas (pdf).
Acerca de su segundo comentario, el
MBESS
paquete R incluye varias utilidades para el cálculo de ES (por ejemplo,smd
y funciones relacionadas).otras referencias
fuente
Parece que cuando la gente dice que Cohen d quiere decir en su mayoría:
Donde es la desviación estándar agrupada,s
Existen otros estimadores para la desviación estándar agrupada, probablemente el más común, aparte de lo anterior:
La notación aquí es notablemente inconsistente, pero a veces la gente dice que la versión (es decir, la versión ) se llama Cohen's , y reserva el nombre Hedge's para la versión que usa (es decir, con la corrección de Bessel, la versión n1 + n2−2). Esto es un poco extraño ya que Cohen describió ambos estimadores para la desviación estándar agrupada (por ejemplo, versión de en la p. 67, Cohen, 1977) antes de que Hedges escribiera sobre ellos (Hedges, 1981).s∗ norte1+ n2 re sol s s
Otras veces, la g de Hedge se reserva para referirse a cualquiera de las versiones con corrección de sesgo de una diferencia de medias estandarizada que desarrolló Hedges. Hedges (1981) mostró que la d de Cohen estaba sesgada hacia arriba (es decir, su valor esperado es mayor que el valor del parámetro de población real), especialmente en muestras pequeñas, y propuso un factor de corrección para corregir la tendencia de d de Cohen:
La cobertura de g (el estimador imparcial):
Sin embargo, este factor de corrección es bastante complejo computacionalmente, por lo que Hedges también proporcionó una aproximación trivial computacional que, aunque todavía está ligeramente sesgada, está bien para casi todos los propósitos concebibles:
Coberturas ' (la aproximación computacionalmente trivial):sol∗
(Originalmente de Hedges, 1981, esta versión de Borenstein, Hedges, Higgins y Rothstein, 2011, p. 27)
Pero, en cuanto a lo que la gente quiere decir cuando dice que d de Cohen vs. g de ged g * g, las personas parecen referirse a cualquiera de estos tres estimadores como Hedge g o Cohen d intercambiablemente, aunque nunca he visto a alguien escribir " "en un documento de investigación no metodológico / estadístico. Si alguien dice "d de Cohen imparcial", solo tendrás que adivinar lo mejor de cualquiera de las dos últimas (¡y creo que incluso podría haber otra aproximación que se haya utilizado para Hedge también!).sol∗ sol∗
Todos son prácticamente idénticos si o menos, y todos pueden interpretarse de la misma manera. A todos los efectos prácticos, a menos que se trate de tamaños de muestra realmente pequeños, probablemente no importa cuál use (aunque si puede elegir, también puede usar el que he llamado Hedges 'g, ya que es imparcial).n > 20
Referencias
Borenstein, M., Hedges, LV, Higgins, JP y Rothstein, HR (2011). Introducción al metanálisis. West Sussex, Reino Unido: John Wiley & Sons.
Cohen, J. (1977). Análisis estadístico del poder de las ciencias del comportamiento (2ª ed.). Hillsdale, NJ, EE. UU .: Lawrence Erlbaum Associates, Inc.
Coberturas, LV (1981). Teoría de la distribución para el estimador de Glass del tamaño del efecto y estimadores relacionados Revista de Estadísticas Educativas, 6 (2), 107-128. doi: 10.3102 / 10769986006002107
Coberturas LV, Olkin I. (1985). Métodos estadísticos para el metanálisis. San Diego, CA: Academic Press
fuente
Si solo está tratando de comprender el significado básico de Hedges 'g, como soy yo, también puede encontrar esto útil:
Su definición es corta y clara:
Agradecería que los expertos en estadísticas editen esto para agregar cualquier advertencia importante al reclamo pequeño (0.2) mediano (0.5) y grande (0.8), para ayudar a los no expertos a evitar malinterpretar los números g de Hedges utilizados en la investigación en ciencias sociales y psicología.
[1] http://www.ncbi.nlm.nih.gov/pmc/articles/PMC2848393/ El efecto de la terapia basada en la atención plena sobre la ansiedad y la depresión: una revisión metaanalítica Stefan G. Hofmann, Alice T. Sawyer, Ashley A. Witt y Diana Oh. J Consulte Clin Psychol. Abril de 2010; 78 (2): 169-183. doi: 10.1037 / a0018555
[2] Cohen J. Análisis de poder estadístico para las ciencias del comportamiento. 2da ed. Erlbaum; Hillsdale, NJ: 1988 (citado en [1])
fuente
Los otros carteles han cubierto el tema de las similitudes y diferencias entre gyd. Solo para agregar a esto, algunos académicos sienten que los valores de tamaño del efecto ofrecidos por Cohen son demasiado generosos y conducen a una interpretación excesiva de los efectos débiles. Tampoco están vinculados a r, lo que lleva a la posibilidad de que los académicos se conviertan de un lado a otro para obtener tamaños de efectos interpretables más favorablemente. Ferguson (2009, Professional Psychology: Research and PRactice) sugirió utilizar los siguientes valores para la interpretación de g:
.41, como mínimo recomendado para "importancia práctica". 1.15, efecto moderado 2.70, efecto fuerte
Obviamente, estos son más rigurosos / difíciles de lograr y no muchos experimentos de ciencias sociales van a tener efectos fuertes ... que probablemente sea así.
fuente
Bruce Thompson advirtió sobre el uso de Cohen (0.2) como pequeño (0.5) como mediano y (0.8) como grande. Cohen nunca quiso que se usaran como interpretaciones rígidas. Todos los tamaños de efectos deben interpretarse según el contexto de la literatura relacionada. Si está analizando los tamaños de efectos relacionados informados sobre su tema y son (0.1) (0.3) (0.24) y produce un efecto de (0.4), entonces eso puede ser "grande". Por el contrario, si toda la literatura relacionada tiene efectos de (0.5) (0.6) (0.7) y usted tiene el efecto de (0.4), puede considerarse pequeño. Sé que este es un ejemplo trivial pero imperativamente importante. Creo que Thompson dijo una vez en un artículo: "Seríamos simplemente estúpidos en una métrica diferente" al comparar las interpretaciones de los tamaños del efecto con la forma en que los científicos sociales interpretaban los valores p en ese momento.
fuente