¿Por qué los nombres tipo 1, error 2?

21

¿Cuál es la motivación para introducir un nivel adicional de indirección del descriptivo 'falso positivo' al entero '1'? ¿Es 'falso positivo' realmente demasiado largo?

Vorac
fuente
10
Estoy contigo, es un nombre horrible. Aprovecho cada oportunidad para no usarlo.
Matthew Drury
55
Mismo. Nunca pude recordar cuál era cuál, hasta que escuché esta forma increíblemente útil de distinguirlos ... En la historia El chico que lloró lobo , los aldeanos primero cometen un error tipo 1 y la segunda vez cometen un error tipo 2 .
Sam
1
@Sam Los recuerdo como en "Lo primero que hace un investigador después de descubrir un efecto es publicar". Pero en el panel derecho hay un enlace a una pregunta con 84 votos a favor sobre cómo recordarlos.
Vorac
Siempre encuentro 'falso positivo' y 'falso negativo' muy confusos. En medicina, 'positivo' se refiere a 'tener la afección' (que ya es confusa y fuente de muchos chistes), pero ¿qué tipo de prueba (estadística) se utiliza para determinar si tiene la afección? Es positivo, tiene la condición, igual a una prueba de salud rechazada (por ejemplo, pruebas de niveles saludables de algún componente, por ejemplo, hierro en la sangre), o es igual a una prueba de enfermedad no rechazada por enfermedad (por ejemplo, pruebas de marcadores que indican la enfermedad, condición u otra cosa como el embarazo)? H0 0H0 0
Sextus Empiricus

Respuestas:

21

Gran pregunta, me motivó a buscarlo en Google :) Según Wikipedia (con ediciones de formato menores):

Un error tipo I (o error del primer tipo) es el rechazo incorrecto de una hipótesis nula verdadera.

Un error de tipo II (o error del segundo tipo) es el fracaso para rechazar una hipótesis nula falsa.

Más abajo en la página se discute la etimología:

En 1928, Jerzy Neyman (1894–1981) y Egon Pearson (1895–1980), ambos eminentes estadísticos, discutieron los problemas asociados con "decidir si una muestra en particular puede juzgarse como extraída al azar de una determinada población". "...

"... en las hipótesis de prueba se deben tener en cuenta dos consideraciones, (1) debemos ser capaces de reducir la posibilidad de rechazar una hipótesis verdadera a un valor tan bajo como se desee; (2) la prueba debe diseñarse de manera tal que rechazará la hipótesis probada cuando es probable que sea falsa ".

También observaron que, al decidir si se debe rechazar o rechazar una hipótesis particular entre un "conjunto de hipótesis alternativas", , ,. . ., fue fácil cometer un error:H1H2

"... [y] estos errores serán de dos tipos:

  • (I) rechazamos [es decir, la hipótesis a probar] cuando es verdad H0 0
  • (II) no podemos rechazar cuando alguna hipótesis alternativa o es cierta ".H0 0HUNAH1

    En el mismo documento llaman a estas dos fuentes de error, errores de tipo I y errores de tipo II, respectivamente.

  • Por lo tanto, parece que el primer tipo de error se basó en el trabajo original de Fisher sobre pruebas de significación. El segundo tipo de error se basó en la extensión de Neyman y Pearson del trabajo de Fisher, a saber, la introducción de la hipótesis alternativa y, por lo tanto, la prueba de hipótesis. Ver aquí para más detalles.

    Parece que el orden en que se identificaron estos tipos de errores corresponde a su número, según lo dado por Neyman y Pearson.

    ilanman
    fuente
    1
    Razones históricas: no es sorprendente. Al igual que las <-macros de sustitución de texto de R y C ++. Gracias por responder a mi pregunta mal investigada. Y gracias a @gung por la buena edición de preguntas.
    Vorac
    3
    Sin embargo, ¿no fue "el orden en que lo pensaron" fuertemente influenciado por el trabajo previo de Fisher? es decir, hasta que Neyman y Pearson introdujeron la idea de una hipótesis alternativa, solo había un "tipo" de error (rechazar H_0 cuando es cierto). Junto con H_A viene la posibilidad de un error "del segundo tipo".
    steeldriver
    Estoy seguro de que lo fue.
    ilanman
    Un pequeño punto que podría ser bueno agregar es que el artículo de 1928 "Sobre el uso e interpretación de ciertos criterios de prueba para fines de inferencia estadística" aún no define las diferentes fuentes de error como errores de "tipo I" y "tipo II" (en cambio, habla del tipo ordenado cuando se relaciona con la distribución de Pearson). Es en 1933 que Neyman y Pearson lo definieron como tipo I y tipo II.
    Sextus Empiricus
    También sería bueno enderezar la cita con las referencias correctas. O al menos la primera cita "... al probar hipótesis dos consideraciones ..." no es literalmente del artículo de 1928.
    Sextus Empiricus