Estoy tratando de encontrar una solución para comparar dos pruebas de "chi-cuadrado de bondad de ajuste". Más precisamente, quiero comparar los resultados de dos experimentos independientes. En estos experimentos, los autores utilizaron el chi-cuadrado de bondad de ajuste para comparar las conjeturas aleatorias (frecuencias esperadas) con las frecuencias observadas. Los dos experimentos obtuvieron el mismo número de participantes y los procedimientos experimentales son idénticos, solo cambiaron los estímulos. Los resultados de los dos experimentos indicaron un chi-cuadrado significativo (exp. 1: X² (18) = 45; p <.0005 y exp. 2: X² (18) = 79; p <.0001).
Ahora, lo que quiero hacer es probar si hay una diferencia entre estos dos resultados. Creo que una solución podría ser el uso de intervalos de confianza, pero no sé cómo calcular estos intervalos de confianza solo con estos resultados. ¿O tal vez una prueba para comparar el tamaño del efecto (Cohen's w)?
¿Alguien tiene una solución?
¡Muchas gracias!
FD
fuente
Respuestas:
¡La información muy limitada que tiene es ciertamente una restricción severa! Sin embargo, las cosas no son del todo inútiles.
Bajo los mismos supuestos que conducen a la distribución asintótica para el estadístico de prueba de la prueba de bondad de ajuste del mismo nombre, el estadístico de prueba bajo la hipótesis alternativa tiene, asintóticamente, una distribución no central χ 2 . Si suponemos que los dos estímulos son a) significativos yb) tienen el mismo efecto, las estadísticas de prueba asociadas tendrán la misma distribución asintótica no central χ 2 . Podemos usar esto para construir una prueba - básicamente, mediante la estimación del parámetro de no centralidad λ y ver si las pruebas estadísticas están lejos de las colas de la no central χ 2 ( 18 , λ )χ2 χ2 χ2 λ χ2( 18 , λ^) distribución. (Sin embargo, eso no quiere decir que esta prueba tendrá mucho poder).
Podemos estimar el parámetro de no centralidad dadas las dos estadísticas de prueba tomando su promedio y restando los grados de libertad (un estimador de métodos de momentos), dando una estimación de 44, o por máxima probabilidad:
Buen acuerdo entre nuestras dos estimaciones, lo que no es sorprendente dados dos puntos de datos y los 18 grados de libertad. Ahora para calcular un valor p:
Por lo tanto, nuestro valor p es 0.12, no es suficiente para rechazar la hipótesis nula de que los dos estímulos son iguales.
que da lo siguiente:
Al observar los puntos de hipótesis nula verdaderos (valor del eje x = 0), vemos que la prueba es conservadora, ya que no parece rechazar tan a menudo como lo indicaría el nivel, pero no de manera abrumadora. Como esperábamos, no tiene mucho poder, pero es mejor que nada. Me pregunto si hay mejores pruebas, dada la cantidad muy limitada de información que tiene disponible.
fuente
Puede obtener la V de Cramer, que se puede interpretar como una correlación, convertirla en una Z de Fisher y luego el intervalo de confianza es sencillo (SE = 1 / sqrt (n-3): Z ± se * 1.96). Después de obtener los extremos del CI, puede convertirlos nuevamente a r.
¿Has considerado poner todos tus recuentos en una tabla de contingencia con una dimensión adicional del experimento?
fuente