Estoy revisando un trabajo que ha realizado> 15 pruebas separadas de 2 x 2 Chi Square. Sugerí que debían corregir las comparaciones múltiples, pero respondieron que todas las comparaciones fueron planificadas y, por lo tanto, esto no es necesario.
Siento que esto no debe ser correcto, pero no puedo encontrar ningún recurso que indique explícitamente si este es el caso.
¿Alguien puede ayudar con esto?
Actualizar:
Gracias por todas sus respuestas muy útiles. En respuesta a la solicitud de @ gung de obtener más información sobre el estudio y los análisis, están comparando los datos de recuento de dos tipos de participantes (estudiantes, no estudiantes) en dos condiciones, en tres períodos de tiempo. Las múltiples pruebas de Chi cuadrado de 2x2 comparan cada período de tiempo, en cada condición, para cada tipo de participante (si eso tiene sentido; por ejemplo, estudiantes, condición 1, período de tiempo 1 versus período de tiempo 2), por lo que todos los análisis prueban la misma hipótesis .
Respuestas:
Este es en mi humilde opinión un tema complejo y me gustaría hacer tres comentarios sobre esta situación.
Primero y en general, me centraría más en si enfrenta un estudio confirmatorio con un conjunto de hipótesis bien formadas definidas en un contexto argumentativo o un estudio explicativo en el que se observan muchos indicadores probables que si están planificados o no (porque puede simplemente planee hacer todas las comparaciones posibles).
Segundo, también me enfocaría en cómo se discuten los valores p resultantes. ¿Se utilizan individualmente para servir a un conjunto de conclusiones definitivas, o se discuten conjuntamente como evidencia y falta de evidencia?
Finalmente, discutiría la posibilidad de que la hipótesis> 15 resultante de las> 15 pruebas de chi-cuadrado separadas sean, de hecho, la expresión de unas pocas hipótesis (tal vez una sola) que pueden resumirse.
En términos más generales, independientemente de si las hipótesis están preespecificadas o no, corregir las comparaciones múltiples o no es una cuestión de lo que se incluye en el error tipo I. Al no corregir MC, solo mantiene un control de tasa de error por tipo de comparación I. Por lo tanto, en caso de numerosas comparaciones, tiene una alta tasa de error familiar tipo I y, por lo tanto, es más propenso a descubrimientos falsos.
fuente
Dada su actualización sobre el diseño, sugeriría que hagan algún tipo de modelo log-lineal para usar todos los datos a la vez. Hacer los análisis por piezas que han hecho parece (a) ineficiente (b) poco científico, ya que prueba 15 hipótesis donde seguramente hay menos hipótesis reales.
No soy fanático de corregir la multiplicidad como un reflejo condicionado, pero en este caso si rechazan un enfoque analítico más profundo, sugeriría que corrijan.
fuente
Si sustituye la palabra 'premeditado' por 'planeado', esto puede ayudar a disipar el argumento ofrecido por los autores. Considere dos análisis estadísticos diferentes de los mismos datos:
De cualquier manera, es 'asesinato': la pregunta es si está en Primer Grado o Segundo Grado. Claramente, el primero es moralmente más problemático. Me parece que los autores aquí intentan reclamar algo en el sentido de que no fue asesinato porque fue premeditado.
fuente
Este documento aborda directamente su pregunta: http://jrp.icaap.org/index.php/jrp/article/view/514/417
(Frane, AV, "Las pruebas de hipótesis planificadas no están necesariamente exentas del ajuste de multiplicidad", Journal of Research Practice, 2015)
fuente