¿Me pueden ayudar a entender el punto de vista frecuentista en el debate bayesiano versus frecuentista? He leído mucho y todas las fuentes que encontré están llenas de ecuaciones complejas o escritas desde un punto de vista bayesiano, o ambas. No he encontrado un solo problema de muestra en el que el enfoque frecuentista produzca resultados más útiles que el enfoque bayesiano. Siento que solo entiendo un lado de este debate y me gustaría entender el otro lado también. No tengo antecedentes en estadística, por lo que agradecería ejemplos simples de casos en los que los métodos frecuentas producen más valor que los métodos bayesianos.
Un buen ejemplo sería un escenario de apuestas en el que un frecuentista y un bayesiano apuestan entre sí sobre algún resultado futuro y el frecuentista tiene un valor esperado positivo.
fuente
Respuestas:
No le daré este ejemplo porque tal ejemplo favorecería un enfoque bayesiano a menos que el bayesiano elija un mal previo, que es un ejemplo de evasión que realmente no vale la pena escribir.
El enfoque más frecuente no está diseñado para obtener el valor más alto esperado en los escenarios de apuestas (afortunadamente, el mundo de las estadísticas y la probabilidad es mucho más amplio que eso). Por el contrario, las técnicas frecuentistas están diseñadas para garantizar ciertas propiedades de frecuencia deseables, particularmente la cobertura. Estas propiedades son importantes para la estimación e inferencia de parámetros en el contexto de la investigación y la investigación científica.
Le animo a que consulte este enlace aquí a una publicación de blog del Dr. Larry Wasserman. En él habla sobre las garantías de frecuencia con mayor profundidad (ver los ejemplos que da).
Supongamos que tenemos algunos datosY y creemos que se distribuye de acuerdo con alguna distribución condicional Y∼ f( YEl |θ∗) (si te gusta puedes imaginar que Y se distribuye normalmente y θ∗ es la media y \ o la varianza). No sabemos el valor deθ∗ , así que tenemos que estimarlo. Podemos utilizar un enfoque frecuentista o bayesiano para hacerlo.
En el enfoque frecuentista obtendríamos una estimación puntualθ^ y un intervalo de confianza para esa estimación. Asumiendo que existe y que el modelo es válido y se comporta bien, el frecuentaθ∗ ( 1 - α ) se garantiza que el intervalo de confianza contendráθ∗ ( 1 - α ) % del tiempo independientemente de qué θ∗ en realidad es . θ∗ podría ser 0, podría ser 1,000,000, podría ser -53.2, no importa, la afirmación anterior es cierta.
Sin embargo, lo anterior no es válido para los intervalos de confianza bayesianos, también conocidos como intervalos creíbles. Esto se debe a que, en un entorno bayesiano, debemos especificar unθ∼π(θ) y simular desde la parte posterior, π(θ|Y)∝f(Y|θ)π(θ) . Podemos formar(1−α) % de intervalos creíbles utilizando la muestra resultante, pero la probabilidad de que estos intervalos contengan θ∗ depende de cuán probable θ∗ está bajo nuestro previo.
En un escenario de apuestas, podemos creer que ciertos valores tienen menos probabilidades de serθ∗ luego otros, y podemos asignar un previo para reflejar estas creencias. Si nuestras creencias son precisas, la probabilidad de contenerθ∗ En el intervalo creíble es mayor. Esta es la razón por la cual las personas inteligentes que usan técnicas bayesianas en escenarios de apuestas superan a los frecuentistas.
Pero considere un escenario diferente, como un estudio donde está probando el efecto de la educación en los salarios, llámeloβ , en un modelo de regresión. Muchos investigadores preferirían el intervalo de confianza deβ tener la propiedad de frecuencia de cobertura en lugar de reflejar sus propios grados de creencia con respecto al efecto de la educación sobre los salarios.
Desde un punto de vista pragmático, también se debe tener en cuenta que en mi ejemplo anterior, a medida que el tamaño de la muestra se acerca al infinito, tanto el frecuentistaθ^ y posterior bayesiano π(θ|Y) converger en θ∗ . Entonces, a medida que obtiene más y más datos, la diferencia entre el enfoque bayesiano y el frecuentista se vuelve insignificante. Dado que la estimación bayesiana es a menudo (no siempre) más computacional y matemáticamente rigurosa que la estimación frecuentista, los profesionales a menudo optan por técnicas frecuentistas cuando tienen conjuntos de datos "grandes". Esto es cierto incluso cuando el objetivo principal es la predicción en oposición a la estimación / inferencia de parámetros.
fuente