Estoy tratando de entender el factor Bayes (BF). Creo que son como la razón de probabilidad de 2 hipótesis. Entonces, si BF es 5, significa que H1 es 5 veces más probable que H0. Y el valor de 3-10 indica evidencia moderada, mientras que> 10 indica evidencia fuerte.
Sin embargo, para el valor P, tradicionalmente 0.05 se toma como límite. Con este valor de P, la razón de probabilidad H1 / H0 debe ser de aproximadamente 95/5 o 19.
Entonces, ¿por qué se toma un límite de> 3 para BF mientras que se toma un límite de> 19 para los valores de P? Estos valores tampoco están cerca.
Respuestas:
Unas pocas cosas:
El BF le brinda evidencia a favor de una hipótesis, mientras que una prueba de hipótesis frecuentista le brinda evidencia en contra de una hipótesis (nula). Entonces es una especie de "manzanas a naranjas".
Estos dos procedimientos, a pesar de la diferencia en las interpretaciones, pueden conducir a decisiones diferentes. Por ejemplo, un BF podría rechazar mientras que una prueba de hipótesis frecuentista no lo hace, o viceversa. Este problema a menudo se conoce como la paradoja de Jeffreys-Lindley . Ha habido muchas publicaciones en este sitio sobre esto; véase, por ejemplo aquí , y aquí .
"Con este valor de P, la probabilidad de H1 / H0 debe ser 95/5 o 19." No, esto no es cierto porque, aproximadamentep(y∣H1)≠1−p(y∣H0) . Calcular un valor p y realizar una prueba frecuente, como mínimo, no requiere que tengas ninguna idea sobre p(y∣H1) . Además, los valores p a menudo son integrales / sumas de densidades / pmfs, mientras que un BF no se integra sobre el espacio de muestra de datos.
fuente
fuente
P = B/(B+1)
Parte de su confusión podría deberse a tomar el número 95/5 directamente del hecho de que el valor p es 0.05, ¿es esto lo que está haciendo? No creo que esto sea correcto. El valor p para una prueba t, por ejemplo, refleja la posibilidad de obtener la diferencia observada entre medias o una diferencia más extrema si la hipótesis nula es de hecho cierta. Si obtiene un valor p de 0.02, usted dice 'ah, solo hay un 2% de posibilidades de obtener una diferencia como esta, o una diferencia mayor, si el valor nulo es verdadero. Eso parece muy improbable, ¡así que propongo que lo nulo no sea cierto! '. Estos números simplemente no son lo mismo que entra en el factor de Bayes, que es la razón de las probabilidades posteriores dadas a cada hipótesis competitiva. Estas probabilidades posteriores no se calculan de la misma manera que el valor p,
Como nota al margen, sugeriría fuertemente evitar pensar en diferentes valores de BF como cosas particulares. Estas asignaciones son completamente arbitrarias, al igual que el nivel de significación .05. Problemas como p-hacking ocurrirán con la misma facilidad con Bayes Factors si la gente comienza a creer que solo números particulares merecen consideración. Intente comprenderlos por lo que son, que son algo así como probabilidades relativas, y use su propio sentido para determinar si encuentra un número BF de evidencia convincente o no.
fuente