En una prueba de significación estadística de rangos con signo de Wilcoxon, encontramos algunos datos que producen un valor de 0.04993 . Con un umbral de p < 0.05 , ¿es este resultado suficiente para rechazar la hipótesis nula, o es más seguro decir que la prueba no fue concluyente, ya que si redondeamos el valor p a 3 decimales se convierte en 0.050 ?
hypothesis-testing
statistical-significance
p-value
Islam El-Nabarawy
fuente
fuente
Respuestas:
Hay dos problemas aquí:
1) Si está haciendo una prueba de hipótesis formal (y si está yendo tan lejos como para citar un valor p en mi libro, ya lo está haciendo), ¿cuál es la regla de rechazo formal?
Al comparar estadísticas de prueba con valores críticos, el valor crítico está en la región de rechazo . Si bien esta formalidad no importa mucho cuando todo es continuo, sí importa cuando la distribución de la estadística de prueba es discreta.
En consecuencia, al comparar valores p y niveles de significación, la regla es:
Tenga en cuenta que, incluso si redondeó su valor p a 0.05, incluso si el valorpags era exactamente 0.05, formalmente, aún debe rechazarlo .
2) En términos de 'cuál es nuestro valor p que nos dice', suponiendo que incluso pueda interpretar un valor p como 'evidencia contra el nulo' (digamos que la opinión al respecto está algo dividida), 0.0499 y 0.0501 no están Realmente decir cosas diferentes sobre los datos (los tamaños de los efectos tienden a ser casi idénticos).
Mi sugerencia sería (1) rechazar formalmente el nulo, y tal vez señalar que incluso si fuera exactamente 0.05, aún debería rechazarse; (2) tenga en cuenta que no hay nada particularmente especial sobreα = 0.05 y está muy cerca de ese límite, incluso un umbral de significación ligeramente menor no conduciría al rechazo.
fuente
Se encuentra en el ojo del espectador.
Así que realmente se reduce a lo que AlefSin comentó antes. No puede haber una "respuesta correcta" a su pregunta. Informe lo que obtuvo, redondeado o no.
Existe una gran literatura sobre el "significado de la importancia"; véase, por ejemplo, el reciente artículo de uno de los principales estadísticos alemanes, Walter Krämer, sobre "El culto a la significación estadística: lo que los economistas deben y no deben hacer para que sus datos hablen", Schmollers Jahrbuch 131 , 455-468, 2011.
fuente
El problema clave es esta frase: "Nos encontramos con algunos datos ...".
Hay un nombre para este tipo de malversación estadística: dragado de datos . Soy ambivalente sobre informarlo en el periódico como una hipótesis interesante; ¿Tiene alguna razón física que espera que se mantenga?
Hay, sin embargo, una salida. Tal vez se decidió a priori para realizar sólo esta una prueba en sólo esta un conjunto de datos. Lo escribiste en tu cuaderno de laboratorio, frente a alguien para poder probarlo más tarde. Entonces hiciste tu prueba.
fuente