¿Cómo interpretar e informar eta cuadrado / eta cuadrado parcial en análisis estadísticamente significativos y no significativos?

39

Tengo datos que tienen valores de eta al cuadrado y valores de eta al cuadrado parcial calculados como una medida del tamaño del efecto para las diferencias de medias de grupo.

  • ¿Cuál es la diferencia entre eta cuadrado y parcial eta cuadrado? ¿Pueden ambos ser interpretados usando las mismas pautas de Cohen (1988 creo: 0.01 = pequeño, 0.06 = mediano, 0.13 = grande)?

  • Además, ¿es útil informar el tamaño del efecto si la prueba de comparación (es decir, la prueba t o ANOVA unidireccional) no es significativa? En mi opinión, esto es como decir "la diferencia de medias no alcanzó significación estadística, pero aún es de particular interés porque el tamaño del efecto indicado desde el cuadrado al cuadrado es medio". ¿O el tamaño del efecto es un valor de reemplazo para la prueba de significación, en lugar de complementario?

Elizabeth corta
fuente
De hecho, SPSS calcula el cuadrado eta parcial para todos los ANOVA. Esto dará el mismo valor que eta cuadrado en los diseños de grupos independientes IV individuales, pero un valor diferente en los diseños de medidas repetidas IV individuales. Esto no deja de tener problemas con mis alumnos.

Respuestas:

43

Tamaños de efectos para diferencias de medias grupales

  • En general, encuentro que las diferencias de medias grupales estandarizadas (p. Ej., Cohen's d) son una medida del tamaño del efecto más significativa dentro del contexto de las diferencias grupales. Las medidas como el cuadrado eta están influenciadas por si los tamaños de las muestras de grupo son iguales, mientras que la d de Cohen no lo es. También creo que el significado de las medidas basadas en d es más intuitivo cuando lo que intenta cuantificar es una diferencia entre las medias grupales.
  • F2
  • Una tercera opción es que, dentro del contexto de los efectos experimentales, incluso cuando hay más de dos grupos, el concepto de efecto se conceptualiza mejor como una comparación binaria (es decir, el efecto de una condición en relación con otra). En este caso, puede volver a tomar medidas basadas en d. La medida basada en d no es una medida del tamaño del efecto para el factor, sino de un grupo relativo a un grupo de referencia. La clave es definir un grupo de referencia significativo.
  • Finalmente, es importante recordar el objetivo más amplio de incluir medidas de tamaño del efecto. Es para darle al lector una idea del tamaño del efecto de interés. Cualquier medida de efecto estandarizada debería ayudar al lector en esta tarea. Si la variable dependiente está en una escala inherentemente significativa, entonces no rehuya interpretar el tamaño del efecto en términos de esa escala. Por ejemplo, escalas como tiempo de reacción, salario, altura, peso, etc. son inherentemente significativas. Si encuentra, como lo hago yo, que el cuadrado no es intuitivo en el contexto de los efectos experimentales, entonces quizás elija otro índice.

Eta al cuadrado versus parcial al cuadrado

  • El eta cuadrado parcial es la medida de tamaño del efecto predeterminada informada en varios procedimientos ANOVA en SPSS. Supongo que es por eso que frecuentemente recibo preguntas al respecto.
  • Si solo tiene una variable de predicción, entonces eta cuadrado al cuadrado es equivalente a eta cuadrado.
  • Este artículo explica la diferencia entre eta al cuadrado y eta al cuadrado parcial (Levine y Hullett Eta al cuadrado, Parcial al cuadrado .. ).
  • En resumen, si tiene más de un predictor, el eta cuadrado parcial es la varianza explicada por una variable dada de la varianza restante después de excluir la varianza explicada por otros predictores.

Reglas prácticas para eta al cuadrado y parcial al cuadrado

  • Si solo tiene un predictor, eta cuadrado y eta cuadrado parcial son los mismos y, por lo tanto, se aplicarían las mismas reglas generales.
  • Si tiene más de un predictor, entonces creo que las reglas generales para eta al cuadrado se aplicarían más a eta al cuadrado parcial que a eta al cuadrado. Esto se debe a que el eta cuadrado parcial en ANOVA factorial podría decirse que se aproxima más estrechamente a lo que habría sido el cuadrado cuadrado para el factor si hubiera sido un ANOVA unidireccional; y es presumiblemente un ANOVA unidireccional que dio lugar a las reglas generales de Cohen. En general, la inclusión de otros factores en un diseño experimental típicamente debería reducir el eta cuadrado, pero no necesariamente el cuadrado al cuadrado debido al hecho de que el segundo factor, si tiene un efecto, aumenta la variabilidad en la variable dependiente.
  • A pesar de lo que digo sobre las reglas generales para eta cuadrado y eta cuadrado cuadrado, reitero que no soy un fanático de las variaciones explicadas de las medidas del tamaño del efecto en el contexto de la interpretación del tamaño y el significado de los efectos experimentales. Igualmente, las reglas generales son solo eso, aproximadas, dependientes del contexto y no deben tomarse demasiado en serio.

Informar el tamaño del efecto en el contexto de resultados significativos y no significativos

  • En cierto sentido, un objetivo de su investigación es estimar varias estimaciones cuantitativas de los efectos de sus variables de interés en la población.
  • Los tamaños del efecto son una cuantificación de una estimación puntual de este efecto. Cuanto más grande sea el tamaño de su muestra, más cercano, en general, su punto de muestreo estimado será el verdadero efecto de la población.
  • En términos generales, las pruebas de significación tienen como objetivo descartar el azar como explicación de sus resultados. Por lo tanto, el valor p le indica la probabilidad de observar un tamaño del efecto como más extremo, suponiendo que la hipótesis nula sea cierta.
  • En última instancia, desea descartar ningún efecto y quiere decir algo sobre el tamaño del verdadero efecto de población. Los intervalos de confianza y los intervalos de credibilidad en torno al tamaño de los efectos son dos enfoques que abordan este problema de manera más directa. Sin embargo, informar valores p y estimaciones puntuales del tamaño del efecto es bastante común y mucho mejor que informar solo valores p o solo medidas del tamaño del efecto.
  • Con respecto a su pregunta específica, si tiene resultados no significativos, es su decisión si informa las medidas de tamaño del efecto. Creo que si tiene una tabla con muchos resultados, entonces tiene sentido tener una columna de tamaño de efecto que se usa independientemente de la importancia. Incluso en contextos no significativos, los tamaños de efecto con intervalos de confianza pueden ser informativos para indicar si los hallazgos no significativos pueden deberse a un tamaño de muestra inadecuado.
Jeromy Anglim
fuente
1
Hola Jeremy: difiero contigo cuando dices "eta cuadrado al cuadrado en ANOVA factorial podría decirse que se aproxima más estrechamente a lo que habría sido el cuadrado cuadrado para el factor si hubiera sido un ANOVA unidireccional". De hecho, eta cuadrado si el predictor se usara solo es probable que sea mucho mayor que su eta cuadrado parcial en compañía de otros predictores. En el último caso, la varianza compartida explicada en el resultado no se acredita al predictor en cuestión; en el primero, no hay "competencia" por la varianza explicada, por lo que el predictor obtiene crédito por cualquier superposición que muestre con el resultado.
rolando2
3
@ rolando2 Quizás mi punto era ambiguo. Me refiero a los experimentos diseñados. Digamos que el experimento 1 manipula el factor A, y el experimento 2 A y B. Suponiendo un diseño equilibrado, ambos factores son ortogonales. Suponiendo que ambos factores explican la varianza, la varianza explicada por el factor A en el experimento 2 será menor que en el experimento 1, donde el nivel del factor B se mantiene constante. Por lo tanto, al comparar experimentos factoriales con experimentos de un factor, creo que el eta cuadrado parcial es más similar entre los experimentos factoriales y de un factor, especialmente si no hay efecto de interacción.
Jeromy Anglim