¿Por qué los errores de tipo II en las pruebas de hipótesis se consideran errores?

8

Estoy leyendo sobre errores de decisión en la prueba de hipótesis. Mi pregunta es ¿por qué se considera que un "error tipo II" es un error? Por lo que entiendo, surge cuando no podemos rechazar una hipótesis nula falsa. Cuando no rechazamos la hipótesis nula, simplemente significa que no tenemos pruebas sólidas para rechazarla. No estamos haciendo ningún comentario sobre cuál de las dos hipótesis es verdadera (o falsa); cualquiera puede ser verdad. No estamos diciendo que la hipótesis nula sea cierta. Por lo tanto, ¿por qué esa conclusión se llama error?

Sanket Kedia
fuente

Respuestas:

5

Es porque no estamos haciendo lo que se supone que debemos hacer cuando la hipótesis alternativa es cierta. Por ejemplo, no estamos usando el nuevo medicamento, que en realidad es mejor que el existente, pero no pudimos probarlo.

Zahava Kor
fuente
Siguiendo esta lógica, no rechazar una hipótesis nula verdadera no debería ser un verdadero positivo. Debería ser un error porque no estamos haciendo lo que se supone que debemos hacer cuando la hipótesis nula es verdadera.
Sanket Kedia
1
¿Por qué decís esto? Por supuesto, estamos haciendo lo que se supone que debemos hacer cuando la hipótesis nula es verdadera: nos mantenemos con el comportamiento actual, que es lo correcto si se supone que la hipótesis nula es verdadera.
Zahava Kor
Conectar NHST con las acciones que generalmente se producen, como lo hace Zahava Kor aquí, parece la forma más simple y directa de apreciar los errores de Tipo II como 'errores'. En algunos contextos, como el del desarrollo de fármacos que Zahava Kor cita específicamente, el NHST está incrustado dentro de un plan de acción de tal manera que el resultado epistémico de la prueba determina acciones. En relación con la medicina en general, ayuda a apreciar el magnífico JAMA de Six Dangerous Words JAMA de
David C. Norris el
4

La forma en que queremos usar la palabra "error" es en última instancia un problema semántico y las personas razonables podrían estar en desacuerdo sobre si, y en qué sentido, deberíamos considerar que un falso negativo es un error .

  • Por un lado, creo que tiene razón en que un resultado no significativo realmente solo significa que no tenemos suficiente información para confiar en que la hipótesis nula es falsa, y que esto no implica lógicamente que la hipótesis nula sea verdadera ( cf., ¿Por qué los estadísticos dicen que un resultado no significativo significa "no se puede rechazar el nulo" en lugar de aceptar la hipótesis nula? ). Entonces, dado el nivel de confianza que requería en su situación y el nivel de ambigüedad en sus datos, tomó la decisión correcta en el sentido de haber aplicado correctamente la regla que había decidido.
  • Por otro lado, si te pones en la posición de alguien que está planeando un estudio. Quieren saber si el nulo es falso. Si realmente es falso, quieren alejarse después de que el estudio se haya completado habiendo rechazado la hipótesis nula. En cambio, no tendrían claridad sobre el tema y tal vez tendrían que diseñar y ejecutar otro estudio. Desde esta perspectiva, no rechazar un falso nulo es definitivamente un resultado subóptimo.
gung - Restablece a Monica
fuente
3
+1. Pero podría ser apropiado plantear el tema de Fisher vs Neyman-Pearson aquí (vincularé a su propia respuesta al respecto: stats.stackexchange.com/questions/23142 ). OP está haciendo la pregunta en lo que parece ser el paradigma de los pescadores. Pero el error tipo II es un concepto del paradigma de Neyman-Pearson. Por lo tanto, creo, la confusión de OP.
ameba
1

La palabra 'falla' está cerca de 'error'.

Para mí, el término error tiene sentido ya que puede calcular una probabilidad de que ocurra (siempre que establezca un cierto tamaño de efecto mínimo que sería deseable detectar). Y desea calcular esta probabilidad en situaciones en las que desea que sea pequeña. En esas situaciones, la falla se consideraría un error.

Para mí es muy simétrico con los errores de tipo I.

Al igual que los valores p, que se relacionan con el error de tipo I, también puede calcular la probabilidad de (falsamente) no rechazar la hipótesis nula. Para un tamaño de efecto dado y una prueba dada (por ejemplo, número de mediciones) puede calcular con qué probabilidad podría ocurrir este 'fallo'.

Estos pensamientos no requieren que establezca un límite para la hipótesis nula.

La tendencia a no considerar los errores de tipo II, o al menos proporcionar los límites del tamaño del efecto que podría haberse detectado con suficiente probabilidad, es grande en un mundo científico que está obsesionado con los valores de p, la importancia y las pruebas de hipótesis (el inverso sucede también poniendo gran énfasis en los efectos menores que resultaron ser significativos, solo por una gran cantidad de mediciones). Sipags es más grande que algunos αentonces se dice / considera que el efecto no está presente (o más elegantemente no se muestra que esté presente). De cualquier manera, ciertamente influye en nuestras acciones futuras como si aceptamos elH0 0.

Sexto Empírico
fuente
1
En realidad, el verdadero error es hacer pruebas de hipótesis.
Sextus Empiricus