¿Cuál es la diferencia entre "prueba de hipótesis" y "prueba de significación"?

17

¿Hay alguna diferencia entre las frases "prueba de hipótesis" y "prueba de significación" o son las mismas?

Después de una respuesta detallada de @Micheal Lew, tengo una confusión de que las hipótesis actuales (p. Ej., Prueba t para probar la media) son ejemplos de "prueba de significación" o "prueba de hipótesis". ¿O es una combinación de ambos? ¿Cómo los diferenciaría con un simple ejemplo?

estadísticas de amor
fuente
3
La prueba t de Student se puede usar para proporcionar un valor p que luego se puede usar en una prueba de significancia de Fisher (el valor p es el nivel de significancia) o en una prueba de hipótesis de Neyman-pearsonian (si el valor p es menor que el alfa preestablecido entonces el resultado es 'significativo'). La diferencia está en lo que se hace con el resultado de la prueba t y no de qué escuela de pensamiento proviene la prueba t (aunque el enfoque de Gossett tenía mucho más en común con Fisher que con NP).
Michael Lew - reinstalar a Monica el

Respuestas:

19

La prueba de significación es lo que ideó Fisher y la prueba de hipótesis es lo que idearon Neyman y Pearson para reemplazar las pruebas de significación. No son lo mismo y son incompatibles entre sí en un grado que sorprendería a la mayoría de los usuarios de pruebas de hipótesis nulas.

Las pruebas de significancia de Fisher producen un valor p que representa cuán extremas son las observaciones bajo la hipótesis nula. Ese valor p es un índice de evidencia contra la hipótesis nula y el nivel de significancia.

Las pruebas de hipótesis de Neyman y Pearson establecen una hipótesis nula y una hipótesis alternativa y funcionan como una regla de decisión para aceptar la hipótesis nula. Brevemente (hay más de lo que puedo poner aquí) usted elige una tasa aceptable de inferencia positiva falsa, alfa (generalmente 0.05), y acepta o rechaza el valor nulo en función de si el valor p está por encima o por debajo de alfa. Debe cumplir con la decisión de la prueba estadística si desea protegerse contra errores falsos positivos.

El enfoque de Fisher le permite tener en cuenta todo lo que quiera al interpretar el resultado, por ejemplo, las pruebas preexistentes pueden tenerse en cuenta de manera informal en la interpretación y presentación del resultado. En el enfoque NP, eso solo se puede hacer en la etapa de diseño experimental, y parece que rara vez se hace. En mi opinión, el enfoque pesquero es más útil en el trabajo biocientífico básico que el enfoque NP.

Existe una literatura sustancial sobre inconsistencias entre las pruebas de significación y las pruebas de hipótesis y sobre la desafortunada hibridación de las dos. Podría comenzar con este artículo: Goodman, hacia las estadísticas médicas basadas en la evidencia. 1: La falacia del valor P http://www.ncbi.nlm.nih.gov/sites/entrez?Db=pubmed&Cmd=ShowDetailView&TermToSearch=10383371

Michael Lew - reinstalar a Mónica
fuente
2
@Micheal Lew - +1 no sabía que Newman / Pearson había acuñado la frase prueba de hipótesis, y la interpreté de una manera bastante más informal. Además, ¿puede explicar cómo mi respuesta es incorrecta, ya que me gustaría corregir cualquier error y siempre estoy ansioso por escuchar sus comentarios?
richiemorrisroe
2
@richiemorrisroe - ¡Neyman y Pearson hicieron más que acuñar una frase! Idearon un paradigma completo para el análisis estadístico, un paradigma que predomina en muchas áreas hoy (a pesar de mi opinión y la de Fisher) de que no es adecuado para la mayoría de los experimentos científicos. Fisher afirmó repetidamente que el enfoque NP solo era relevante para las pruebas de aceptación industrial. La mayoría de los textos estadísticos introductorios no incluyen suficientes detalles e historia para permitir que los estudiantes comprendan que existen diferencias importantes entre las escuelas de pensamiento sobre las pruebas estadísticas. Es desafortunado.
Michael Lew - reinstalar a Mónica el
0

En muchos casos, estas dos declaraciones significan lo mismo. Sin embargo, también pueden ser bastante diferentes.

Probar una hipótesis consiste en decir primero lo que cree que ocurrirá con algún fenómeno, luego desarrollar algún tipo de prueba para este fenómeno y luego determinar si el fenómeno realmente ocurrió o no. En muchos casos, la prueba de una hipótesis no necesita involucrar ningún tipo de prueba estadística. El físico Ernest Rutherford me recuerda esta cita: si su experimento necesita estadísticas, debería haber hecho un experimento mejor. Dicho esto, la prueba de hipótesis normalmente utiliza algún tipo de herramienta estadística.

En contraste, la prueba de significación es un concepto puramente estadístico. En esencia, uno tiene dos hipótesis: la hipótesis nula, que establece que no hay diferencia entre sus dos (o más) colecciones de datos. La hipótesis alternativa es que hay una diferencia entre sus dos muestras que no ocurrió por casualidad.

Basado en el diseño de su estudio, luego compara las dos (o más) muestras usando una prueba estadística, que le da un número, que luego compara con una distribución de referencia (como las distribuciones normales, t o F) y si Esta estadística de prueba excede un valor crítico, rechaza la hipótesis nula y concluye que hay una diferencia entre las dos (o más) muestras. Este criterio es normalmente que la probabilidad de que la diferencia ocurra por casualidad es menor que uno de cada veinte (p <0.05), aunque a veces se usan otros.

richiemorrisroe
fuente
¿Podría dar algún ejemplo donde las pruebas de hipótesis no involucren ningún tipo de pruebas estadísticas?
love-stats
Esta es una representación inexacta de pruebas de significación y pruebas de hipótesis.
Michael Lew - reinstalar a Mónica el
@ user152509 supongo que realizo un estudio en el que entrevisto a usuarios y no usuarios de un producto en particular. Supongo que los no usuarios se centrarán en las desventajas de dicho producto, mientras que los usuarios hablarán sobre cómo el producto los ayuda. Esto es lo que observo, de ahí una hipótesis probada sin estadísticas.
richiemorrisroe
2
Es importante discriminar entre una hipótesis científica y una hipótesis estadística. La hipótesis nula probada por las pruebas estadísticas de hipótesis nula suele ser solo una última. Probar una hipótesis estadística bien diseñada puede permitir inferencia con respecto a la hipótesis científica, pero no siempre es así.
Michael Lew - reinstalar a Mónica el
@Micheal Lew, tengo una confusión de que hoy en día las hipótesis (p. Ej., Prueba t para probar la media) son ejemplos de "prueba de significación" o "prueba de hipótesis". ¿O es una combinación de ambos? ¿Cómo los diferenciaría con un simple ejemplo?
love-stats