Preferencias bayesianas no informativas versus hipótesis nulas frecuentistas: ¿cuál es la relación?

11

Encontré esta imagen en una publicación de blog aquí .

¡Alguien en un pozo de mosh experimentando un EUREKA!  momento

Me decepcionó que leer la declaración no provocara la misma expresión facial para mí que para este tipo.

Entonces, ¿qué significa la afirmación de que la hipótesis nula es la frecuencia con la que los expresionistas expresan un previo poco informativo? ¿Es realmente cierto?


Editar: Espero que alguien pueda ofrecer una interpretación caritativa que haga que la afirmación sea verdadera, incluso en cierto sentido.

jerad
fuente
3
No creo que sea exacto. Primero, ¿alguien puede escribir la probabilidad de una prueba T? Entonces podemos comenzar a hablar de analogías. Bueno, y si no puedes ... esa imagen no tiene sentido.
joint_p

Respuestas:

10

La hipótesis nula no es equivalente a una previa no informativa bayesiana por la sencilla razón de que los bayesianos también pueden usar hipótesis nulas y realizar pruebas de hipótesis utilizando los factores de Bayes. Si fueran equivalentes, los bayesianos no usarían hipótesis nulas.

Sin embargo, tanto las pruebas de hipótesis bayesianas como las frecuentas incorporan un elemento de autoescepticismo, ya que debemos demostrar que existe alguna evidencia de que nuestra hipótesis alternativa es de alguna manera una explicación más plausible para las observaciones que el azar. Los frecuentes hacen esto al tener un nivel de significancia, los bayesianos lo hacen al tener una escala de interpretación para el factor Bayes, de modo que no promulguemos una hipótesis a menos que el factor Bayes sobre la hipótesis nula fuera suficientemente alto.

Ahora, la razón por la cual las pruebas de hipótesis frecuentistas son contra-intuitivas es porque un frecuentista no puede asignar una probabilidad no trivial a la verdad de una hipótesis, que lamentablemente generalmente es lo que realmente queremos. Lo más cerca que pueden llegar a esto es calcular el valor p (la probabilidad de las observaciones bajo H0) y luego sacar una conclusión subjetiva de esto en cuanto a si H0 o H1 son plausibles. El bayesiano puede asignar una probabilidad a la verdad de una hipótesis y, por lo tanto, puede calcular la razón de estas probabilidades para proporcionar una indicación de sus posibilidades relativas, o al menos de cómo las observaciones cambian la razón de estas probabilidades (que es lo que El factor Bayes sí).

En mi opinión, es una mala idea tratar de establecer un paralelismo demasiado estrecho entre los métodos de prueba de hipótesis bayesianas y frecuentistas, ya que son fundamentalmente diferentes y responden preguntas fundamentalmente diferentes. Tratarlos como si fueran equivalentes fomenta una interpretación bayesiana de la prueba frecuentista (por ejemplo, la falacia del valor p) que es potencialmente peligrosa (por ejemplo, los escépticos climáticos a menudo suponen que la falta de una tendencia estadísticamente significativa en la temperatura media global de la superficie significa que existe no se ha calentado, lo cual no es del todo correcto).

Dikran Marsupial
fuente
9

La razón por la que no tienes la misma mirada epifánica en la cara que ese tipo es porque creo que eso. . . La afirmación no es cierta.

Una hipótesis nula es la hipótesis de que cualquier diferencia entre las condiciones experimentales y de control se debe al azar.

Un previo no informativo tiene la intención de indicar que tiene datos previos sobre una pregunta, pero que no le dice nada sobre qué esperar esta próxima vez. Es probable que un bayesiano sostenga que hay información en cualquier distribución anterior, incluso uniforme.

Entonces, la hipótesis nula dice que no hay diferencia entre control y experimental; un previo no informativo, por otro lado, puede o no ser posible, y si lo hiciera, no indicaría nada sobre la diferencia entre control y experimental (que es diferente de indicar que cualquier diferencia se debe al azar).

Sin embargo, quizás me falta mi comprensión de los antecedentes no informativos. Espero otras respuestas.

Krysta
fuente
2
Solo agregaría que los antecedentes no informativos tienen más que ver con la actitud del investigador que con las propiedades especialmente interesantes de la distribución en sí. Esta es la actitud que argumenta Gelman en Bayesian Data Analysis, aunque parece que no puedo encontrar el número de página.
Sycorax dice Reinstate Monica el
77
La hipótesis nula no es siempre la misma. La hipótesis nula es solo una hipótesis alternativa "aburrida" que se compara con su hipótesis "interesante", para ver si los datos son compatibles entre sí. En realidad, "no hay diferencia" es en realidad una mala hipótesis nula, ya que sabes a priori que es falsa. Mejor es "la diferencia está por debajo de algún umbral de mi cuidado".
Stumpy Joe Pete
Gracias por la respuesta @Krysta, y básicamente tuve los mismos pensamientos sobre la declaración, pero ¿quizás hay una sensación en la que la declaración es cierta?
jerad
Mi mejor conjetura es que la hipótesis nula es el punto de partida para los frecuentistas, ¿o el conjunto vacío de hipótesis ?; tal vez este escritor piense que el previo no informativo es el punto de partida para los bayesianos, pero un previo informativo regular es un mejor análogo si eso es lo que querían decir. La hipótesis nula y el previo poco informativo tienen similitudes conceptuales: ambos se basan en suponer que no hay información / efecto. ¡Pero eso es bastante vago!
Krysta
"Es probable que un bayesiano sostenga que hay información en cualquier previo". Pero, un Jeffreys anterior no es informativo.
Neil G
4

Ver este artículo de Wikipedia :

Para el caso de un solo parámetro y datos que se pueden resumir en una sola estadística suficiente, se puede demostrar que el intervalo creíble y el intervalo de confianza coincidirán si el parámetro desconocido es un parámetro de ubicación (...) con un previo que es una distribución plana uniforme (...) y también si el parámetro desconocido es un parámetro de escala (...) con un previo de Jeffreys.

De hecho, la referencia apunta a Jaynes:

Jaynes, ET (1976), Intervalos de confianza vs Intervalos bayesianos .

En la página 185 podemos encontrar:

Si surge el caso (I) (y ocurre con más frecuencia de lo que se cree), las pruebas bayesianas y ortodoxas nos llevarán exactamente a los mismos resultados y a la misma conclusión, con un desacuerdo verbal sobre si deberíamos usar 'probabilidad' o ' significado 'para describirlos.

Entonces, de hecho, hay casos similares, pero no diría que la declaración en la imagen es verdad si, por ejemplo, está utilizando una distribución de Cauchy como probabilidad ...

random_user
fuente
4

Soy el que creó el gráfico, aunque, como se señaló en la publicación adjunta, no es originalmente mi idea. Permítanme proporcionar un contexto sobre cómo surgió y hacer todo lo posible para explicar cómo lo entiendo. La realización ocurrió durante una discusión con un estudiante que había aprendido principalmente el enfoque bayesiano de la inferencia hasta ese momento. Le estaba costando entender todo el paradigma de la prueba de hipótesis, y estaba haciendo todo lo posible para explicar este enfoque decididamente confuso (si considera que la "diferencia" es negativa, como noigual a - entonces el enfoque estándar de hipótesis nula es un triple negativo: el objetivo de los investigadores es mostrar que no hay diferencia). En general, y como se indicó en otra respuesta, los investigadores generalmente esperan que exista alguna diferencia; lo que realmente esperan encontrar es evidencia convincente para "rechazar" lo nulo. Sin embargo, para ser imparciales, comienzan fingiendo esencialmente ignorancia, como en "Bueno, tal vez este medicamento no tenga ningún efecto en las personas". Luego proceden a demostrar a través de la recopilación y el análisis de datos (si pueden), que esta hipótesis nula, dados los datos, era una mala suposición.

Para un bayesiano, esto debe parecer un punto de partida complicado. ¿Por qué no comenzar simplemente anunciando sus creencias anteriores directamente, y tener claro lo que está asumiendo (y no está) al codificarlo en un previo? Un punto clave aquí es que un prior uniforme no eslo mismo que un previo no informativo. Si lanzo una moneda 1000 veces y obtengo 500 caras, mi nuevo anterior asigna el mismo peso (uniforme) a ambas caras y colas, pero su curva de distribución es muy pronunciada. ¡Estoy codificando información adicional que es altamente informativa! Un verdadero previo no informativo (llevado al límite) no tendría ningún peso. Significa, en efecto, comenzar desde cero y, para usar una expresión frecuentista, dejar que los datos hablen por sí mismos. La observación hecha por "Clarence" fue que la forma frecuente de codificar esta falta de información es con la hipótesis nula. No es exactamente lo mismo que un previo poco informativo; Es el enfoque frecuentista para expresar la ignorancia máxima de una manera honesta, una que no presume lo que desea probar.

Matt Asher
fuente
2
La hipótesis nula frecuentista no expresa la ignorancia máxima, comienza a suponer que la hipótesis nula es verdadera y solo deberíamos proceder con la hipótesis alternativa si las observaciones son suficientemente improbables bajo H0. Se podría argumentar que la prueba de hipótesis nulas codifica algunas anteriores, pero es decididamente informativa. En mi opinión, intentar interpretar las pruebas de hipótesis frecuentistas en términos bayesianos es erróneo y una receta para el error; No son respuestas a la misma pregunta.
Dikran Marsupial
@Dikran Marsupial esto es en cierta medida un debate interminable, pero desde la perspectiva más frecuente no veo forma de ver el nulo como "decididamente informativo". Si este fuera el caso, entonces no rechazar el nulo sería visto como prueba del nulo (ya que "ya" tenemos información sobre el nulo). En mi opinión, todos los enfoques de inferencia intentan responder las mismas preguntas interrelacionadas: "¿Cómo deben interpretarse los datos?" y "¿qué tan fuerte es el caso?"
Matt Asher
1
El nulo en sí mismo no es informativo o no informativo, pero la prueba de hipótesis frecuentista convencional está sesgada inherentemente (y con bastante razón) hacia el H0 (a menos que también realice un análisis de potencia). Este sesgo se puede comparar con un previo, pero sería informativo. Simplemente no tiene sentido comparar antecedentes e hipótesis, tienen diferentes propósitos en el análisis; note Bayesian también usa hipótesis nulas en la prueba de hipótesis (vea mi respuesta a la pregunta) donde sirve para el mismo propósito que en la prueba de hipótesis frecuentista.
Dikran Marsupial
3
Para ser claros, usando el ejemplo de la droga, no comenzamos fingiendo ignorancia "Bueno, tal vez esta droga tiene cero efecto en las personas", comenzamos asumiendo que la hipótesis nula es correcta "La droga tiene cero efecto y está activa a la compañía farmacéutica para establecer que tiene un efecto al demostrar que los resultados no pueden explicarse adecuadamente por casualidad ". El autoescepticismo que proporciona este enfoque es la razón por la cual el "ritual nulo", a pesar de sus muchos defectos, sigue siendo de valor práctico en la ciencia.
Dikran Marsupial