Una limitación básica de la prueba de significación de hipótesis nula es que no permite que un investigador recopile evidencia a favor de la nula ( Fuente )
Veo esta afirmación repetida en varios lugares, pero no puedo encontrar justificación para ello. Si realizamos un estudio grande y no encontramos evidencia estadísticamente significativa contra la hipótesis nula , ¿no es esa evidencia de la hipótesis nula?
hypothesis-testing
Atte Juvonen
fuente
fuente
Respuestas:
No rechazar una hipótesis nula es evidencia de que la hipótesis nula es verdadera, pero podría no ser una evidencia particularmente buena , y ciertamente no prueba la hipótesis nula.
Hagamos un pequeño desvío. Considere por un momento el viejo cliché:
A pesar de su popularidad, esta afirmación no tiene sentido. Si busca algo y no lo encuentra, eso es absolutamente evidencia de que no está allí. Lo buena que sea esa evidencia depende de cuán exhaustiva fue su búsqueda. Una búsqueda superficial proporciona evidencia débil; Una búsqueda exhaustiva proporciona pruebas contundentes.
Ahora, de vuelta a la prueba de hipótesis. Cuando ejecuta una prueba de hipótesis, está buscando evidencia de que la hipótesis nula no es cierta. Si no lo encuentra, entonces eso es ciertamente evidencia de que la hipótesis nula es cierta, pero ¿qué tan fuerte es esa evidencia? Para saberlo, debe saber qué tan probable es que la evidencia que lo hubiera hecho rechazar la hipótesis nula podría haber eludido su búsqueda. Es decir, ¿cuál es la probabilidad de un falso negativo en su prueba? Esto está relacionado con el poder, , de la prueba (específicamente, es el complemento, 1- ).ββ β
Ahora, el poder de la prueba y, por lo tanto, la tasa de falsos negativos, generalmente depende del tamaño del efecto que está buscando. Los efectos grandes son más fáciles de detectar que los pequeños. Por lo tanto, no hay una única para un experimento y, por lo tanto, no hay una respuesta definitiva a la pregunta de qué tan fuerte es la evidencia de la hipótesis nula. Dicho de otra manera, siempre hay un tamaño de efecto lo suficientemente pequeño como para que el experimento no lo descarte.β
A partir de aquí, hay dos formas de proceder. A veces sabes que no te importa un tamaño de efecto más pequeño que un umbral. En ese caso, probablemente debería replantear su experimento de modo que la hipótesis nula sea que el efecto está por encima de ese umbral, y luego probar la hipótesis alternativa de que el efecto está por debajo del umbral. Alternativamente, puede usar sus resultados para establecer límites en el tamaño creíble del efecto. Su conclusión sería que el tamaño del efecto se encuentra en algún intervalo, con cierta probabilidad. Ese enfoque está a solo un pequeño paso de un tratamiento bayesiano, del que tal vez quiera aprender más, si se encuentra con frecuencia en este tipo de situación.
Hay una buena respuesta a una pregunta relacionada que toca pruebas de pruebas de ausencia , que pueden serle útiles.
fuente
NHST se basa en valores p, que nos dicen: Dada la hipótesis nula, ¿cuál es la probabilidad de que observemos nuestros datos (o datos más extremos)?
Suponemos que la hipótesis nula es verdadera: se calcula en NHST que la hipótesis nula es 100% correcta. Los valores p pequeños nos dicen que, si la hipótesis nula es verdadera, nuestros datos (o datos más extremos) no son probables.
Pero, ¿qué nos dice un valor p grande? Nos dice que, dada la hipótesis nula, nuestros datos (o datos más extremos) son probables.
En términos generales, P (A | B) ≠ P (B | A).
Imagine que desea tomar un valor p grande como evidencia de la hipótesis nula. Confiaría en esta lógica:
Si el valor nulo es verdadero, entonces es probable un valor p alto.( Actualización: no es cierto. Vea los comentarios a continuación ) .Esto toma la forma más general:
Sin embargo, esto es falaz, como se puede ver en un ejemplo:
El suelo bien podría estar mojado porque llovió. O podría deberse a un rociador, alguien limpiando sus canaletas, una tubería principal rota, etc. Se pueden encontrar ejemplos más extremos en el enlace de arriba.
Es un concepto muy difícil de entender. Si queremos evidencia para el nulo, se requiere inferencia bayesiana. Para mí, la explicación más accesible de esta lógica es la de Rouder et al. (2016) en papel ¿Hay un almuerzo gratis en inferencia? publicado en Topics in Cognitive Science, 8, pp. 520–547.
fuente
Para comprender lo que está mal con el supuesto, vea el siguiente ejemplo:
Imagina un recinto en un zoológico donde no puedes ver a sus habitantes. Desea probar la hipótesis de que está habitada por monos poniendo un plátano en la jaula y verifique si se ha ido al día siguiente. Esto se repite N veces para una mayor significación estadística.
Ahora puede formular una hipótesis nula: dado que hay monos en el recinto, es muy probable que encuentren y coman el plátano, por lo que si los plátanos no se tocan todos los días, es muy improbable que haya monos dentro.
Pero ahora ves que las bananas se han ido (casi) cada día. ¿Eso te dice que hay monos adentro?
Por supuesto que no, porque hay otros animales a los que también les gustan los plátanos, o tal vez algún cuidadoso cuidador del zoológico lo retira todas las noches.
Entonces, ¿cuál es el error que se comete en esta lógica? El punto es que no sabes nada sobre la probabilidad de que las bananas se vayan si no hay monos adentro. Para corroborar la hipótesis nula, la probabilidad de desaparecer los plátanos debe ser pequeña si la hipótesis nula es incorrecta, pero no es necesario que sea así. De hecho, el evento puede ser igualmente probable (o incluso más probable) si la hipótesis nula es incorrecta.
Sin conocer esta probabilidad, no puede decir exactamente nada sobre la validez de la hipótesis nula. Si los cuidadores del zoológico eliminan todas las bananas cada noche, el experimento no tiene ningún valor, a pesar de que a primera vista parece haber corroborado la hipótesis nula.
fuente
En su famoso artículo Por qué los hallazgos de investigación más publicados son falsos , Ioannidis utilizó el razonamiento bayesiano y la falacia de la tasa base para argumentar que la mayoría de los hallazgos son falsos positivos. En breve, la probabilidad posterior al estudio de que una hipótesis de investigación particular sea verdadera depende, entre otras cosas, de la probabilidad previa al estudio de dicha hipótesis (es decir, la tasa base).
Como respuesta, Moonesinghe et al. (2007) utilizaron el mismo marco para mostrar que la replicación aumenta en gran medida la probabilidad posterior al estudio de que una hipótesis sea cierta. Esto tiene sentido: si varios estudios pueden replicar un determinado hallazgo, estamos más seguros de que la hipótesis conjeturada es cierta.
El gráfico muestra que si al menos 5 de cada 10 estudios no alcanzan su importancia, nuestra probabilidad posterior al estudio de que la hipótesis sea verdadera es casi 0. Las mismas relaciones existen para más estudios. Este hallazgo también tiene sentido intuitivo: una falla repetida en encontrar un efecto fortalece nuestra creencia de que el efecto es probablemente falso. Este razonamiento está en línea con la respuesta aceptada por @RPL.
Como segundo escenario, supongamos que los estudios tienen solo un poder del 50% (todo lo demás igual).
Ahora, nuestra probabilidad posterior al estudio disminuye más lentamente, porque cada estudio tenía solo poca potencia para encontrar el efecto, si es que realmente existía.
fuente
If you have a negative, you found evidence against the null
- ¿Qué? La palabra "negativo" tiene exactamente el significado opuesto. Un valor p significativo se llama resultado "positivo"; un no significativo es un "negativo".La mejor explicación que he visto para esto es de alguien cuyo entrenamiento es en matemáticas.
fuente
Si no le gusta esta consecuencia de la prueba de hipótesis pero no está preparado para dar el salto completo a los métodos bayesianos, ¿qué tal un intervalo de confianza?
fuente
Quizás sería mejor decir que el no rechazo de una hipótesis nula no es en sí misma evidencia de la hipótesis nula. Una vez que consideramos la probabilidad total de los datos, que considera más explícitamente la cantidad de datos, los datos recopilados pueden proporcionar soporte para los parámetros que caen dentro de la hipótesis nula.
Sin embargo, también debemos pensar cuidadosamente sobre nuestras hipótesis. En particular, no rechazar una hipótesis de punto nulo no es una evidencia muy buena de que la hipótesis de punto nulo sea verdadera. Siendo realistas, acumula evidencia de que el verdadero valor del parámetro no está tan lejos del punto en cuestión. Las hipótesis de punto nulo son, en cierta medida, construcciones más bien artificiales y, a menudo, usted no cree realmente que serán exactamente ciertas.
Se vuelve mucho más razonable hablar sobre el no rechazo que respalda la hipótesis nula, si puede revertir significativamente la hipótesis nula y alternativa y si al hacerlo rechazaría su nueva hipótesis nula. Cuando intenta hacer eso con una hipótesis nula de punto estándar, inmediatamente ve que nunca podrá rechazar su complemento, porque su hipótesis nula invertida contiene valores arbitrariamente cercanos al punto en consideración.
fuente
Más bien depende de cómo estés usando el lenguaje. Según la teoría de decisión de Pearson y Neyman, no es evidencia de lo nulo, pero debe comportarse como si lo nulo fuera cierto.
La dificultad proviene de modus tollens. Los métodos bayesianos son una forma de razonamiento inductivo y, como tal, son una forma de razonamiento incompleto. Los métodos de hipótesis nula son una forma probabilística de modus tollens y, como tales, son parte del razonamiento deductivo y, por lo tanto, es una forma completa de razonamiento.
Modus tollens tiene la forma "si A es verdadero, entonces B es verdadero y B no es verdadero; por lo tanto, A no es verdadero". De esta forma, si el nulo es verdadero, los datos aparecerán de una manera particular, no aparecerán de esa manera, por lo tanto (hasta cierto punto de confianza) el nulo no es verdadero (o al menos está "falsificado" ".
El problema es que quieres "Si A, entonces B y B." A partir de esto, desea inferir A, pero eso no es válido. "Si A entonces B", no excluye "si no A entonces B" de ser también una declaración válida. Considere la afirmación "si es un oso, entonces puede nadar. Es un pez (no un oso)". Las declaraciones no dicen nada sobre la capacidad de los no osos para nadar.
La probabilidad y la estadística son una rama de la retórica y no una rama de las matemáticas. Es un gran usuario de las matemáticas, pero no es parte de las matemáticas. Existe por una variedad de razones, persuasión, toma de decisiones o inferencia. Extiende la retórica a una discusión disciplinada de la evidencia.
fuente
Trataré de ilustrar esto con un ejemplo.
fuente
fuente
Sigamos un ejemplo simple.
Mi hipótesis nula es que mis datos siguen una distribución normal. La hipótesis alternativa es que la distribución de mis datos no es normal.
Extraigo dos muestras aleatorias de una distribución uniforme en [0,1]. No puedo hacer mucho con solo dos muestras, por lo tanto, no podría rechazar mi hipótesis nula.
¿Eso significa que puedo concluir que mis datos siguen una distribución normal? ¡No, es una distribución uniforme!
El problema es que hice la suposición de normalidad en mi hipótesis nula. Por lo tanto, no puedo concluir que mi suposición es correcta porque no puedo rechazarla.
fuente
fuente
No, no es evidencia a menos que tenga evidencia de que es evidencia. No estoy tratando de ser lindo, sino literal. Solo tiene probabilidad de ver tales datos dado su suposición de que el nulo es verdadero. Eso es TODO lo que obtienes del valor p (si eso es así, ya que el valor p se basa en suposiciones).
¿Puede presentar un estudio que muestre que para los estudios que "no logran" apoyar la hipótesis nula, la mayoría de las hipótesis nulas resultan ser ciertas? Si puede encontrar ESE estudio, entonces su incapacidad para refutar las hipótesis nulas al menos refleja una probabilidad MUY generalizada de que el nulo es verdadero. Apuesto a que no tienes ese estudio. Dado que no se evidencia que las hipótesis nulas sean verdaderas en función de los valores p, solo tiene que alejarse con las manos vacías.
Comenzó asumiendo que su valor nulo era verdadero para obtener ese valor p, por lo que el valor p no puede decirle nada sobre el valor nulo, solo sobre los datos. Piénsalo. Es una inferencia unidireccional, punto.
fuente