Ejemplos concretos de un enfoque frecuentista que es superior a uno bayesiano [cerrado]

¿Me pueden ayudar a entender el punto de vista frecuentista en el debate bayesiano versus frecuentista? He leído mucho y todas las fuentes que encontré están llenas de ecuaciones complejas o escritas desde un punto de vista bayesiano, o ambas. No he encontrado un solo problema de muestra en el que el enfoque frecuentista produzca resultados más útiles que el enfoque bayesiano. Siento que solo entiendo un lado de este debate y me gustaría entender el otro lado también. No tengo antecedentes en estadística, por lo que agradecería ejemplos simples de casos en los que los métodos frecuentas producen más valor que los métodos bayesianos.

Un buen ejemplo sería un escenario de apuestas en el que un frecuentista y un bayesiano apuestan entre sí sobre algún resultado futuro y el frecuentista tiene un valor esperado positivo.

bayesian frequentist Atte Juvonen
fuente

Seguramente podría encontrar algunas decenas de miles de tales ejemplos simplemente navegando por este sitio. A la luz de esto, ¿qué tipo de respuestas estás buscando?

whuber

Después de 2 horas de búsqueda en Google, encontré 0 ejemplos en los que el enfoque frecuentista es más útil que el bayesiano. Si tiene 10 000 ejemplos, ¿puede proporcionar 1 de ellos? Gracias.

Atte Juvonen

No sé si esto está en el nivel que le gustaría, pero puede encontrar una discusión relevante en el libro de L. Wasserman que también está disponible en línea. read.pudn.com/downloads158/ebook/702714/… . Si va a la página 216, encontrará un ejemplo sobre intervalos de confianza en los que el enfoque frecuentista supera al bayesiano.

JohnK

@whuber: No creo que su definición de "útil" difiera de la mía en una forma en la que sea significativo discutir al respecto. No estoy aquí para inferir ese bayesiano> frecuentista. Recientemente he aprendido sobre estos temas y siento que solo entiendo un lado del debate. Me gustaría entender el otro lado también. Me resulta más fácil comprender nuevos conceptos a través de ejemplos prácticos; en este caso, un ejemplo donde el frecuentismo proporciona algo de valor (donde los métodos bayesianos se quedan cortos)

Atte Juvonen

Yo voto para reabrir. @whuber, el hecho de que más de 20k personas vinieron aquí para hacer una pregunta sobre técnicas frecuentistas y obtuvieron una respuesta útil no implica que las técnicas frecuentas fueran más apropiadas que las bayesianas en esos casos específicos; solo significa que están muy extendidos.

ameba

Un buen ejemplo sería un escenario de apuestas en el que un frecuentista y un bayesiano apuestan entre sí sobre algún resultado futuro y el frecuentador tiene un valor esperado positivo.

No le daré este ejemplo porque tal ejemplo favorecería un enfoque bayesiano a menos que el bayesiano elija un mal previo, que es un ejemplo de evasión que realmente no vale la pena escribir.

El enfoque más frecuente no está diseñado para obtener el valor más alto esperado en los escenarios de apuestas (afortunadamente, el mundo de las estadísticas y la probabilidad es mucho más amplio que eso). Por el contrario, las técnicas frecuentistas están diseñadas para garantizar ciertas propiedades de frecuencia deseables, particularmente la cobertura. Estas propiedades son importantes para la estimación e inferencia de parámetros en el contexto de la investigación y la investigación científica.

Le animo a que consulte este enlace aquí a una publicación de blog del Dr. Larry Wasserman. En él habla sobre las garantías de frecuencia con mayor profundidad (ver los ejemplos que da).

Supongamos que tenemos algunos datos $Y$ y creemos que se distribuye de acuerdo con alguna distribución condicional $Y \sim f(Y|\theta^*)$ (si te gusta puedes imaginar que $Y$ se distribuye normalmente y $\theta^*$ es la media y \ o la varianza). No sabemos el valor de $\theta^*$ , así que tenemos que estimarlo. Podemos utilizar un enfoque frecuentista o bayesiano para hacerlo.

En el enfoque frecuentista obtendríamos una estimación puntual $\hat \theta$ y un intervalo de confianza para esa estimación. Asumiendo que existe y que el modelo es válido y se comporta bien, el frecuenta $\theta^*$ $(1-\alpha)$ se garantiza que el intervalo de confianza contendrá $\theta^*$ $(1-\alpha)$ % del tiempo independientemente de qué $\theta^*$ en realidad es . $\theta^*$ podría ser 0, podría ser 1,000,000, podría ser -53.2, no importa, la afirmación anterior es cierta.

Sin embargo, lo anterior no es válido para los intervalos de confianza bayesianos, también conocidos como intervalos creíbles. Esto se debe a que, en un entorno bayesiano, debemos especificar un $\theta \sim \pi(\theta)$ y simular desde la parte posterior, $\pi(\theta|Y) \propto f(Y|\theta)\pi(\theta)$ . Podemos formar $(1-\alpha)$ % de intervalos creíbles utilizando la muestra resultante, pero la probabilidad de que estos intervalos contengan $\theta^*$ depende de cuán probable $\theta^*$ está bajo nuestro previo.

En un escenario de apuestas, podemos creer que ciertos valores tienen menos probabilidades de ser $\theta^*$ luego otros, y podemos asignar un previo para reflejar estas creencias. Si nuestras creencias son precisas, la probabilidad de contener $\theta^*$ En el intervalo creíble es mayor. Esta es la razón por la cual las personas inteligentes que usan técnicas bayesianas en escenarios de apuestas superan a los frecuentistas.

Pero considere un escenario diferente, como un estudio donde está probando el efecto de la educación en los salarios, llámelo $\beta$ , en un modelo de regresión. Muchos investigadores preferirían el intervalo de confianza de $\beta$ tener la propiedad de frecuencia de cobertura en lugar de reflejar sus propios grados de creencia con respecto al efecto de la educación sobre los salarios.

Desde un punto de vista pragmático, también se debe tener en cuenta que en mi ejemplo anterior, a medida que el tamaño de la muestra se acerca al infinito, tanto el frecuentista $\hat \theta$ y posterior bayesiano $\pi(\theta|Y)$ converger en $\theta^*$ . Entonces, a medida que obtiene más y más datos, la diferencia entre el enfoque bayesiano y el frecuentista se vuelve insignificante. Dado que la estimación bayesiana es a menudo (no siempre) más computacional y matemáticamente rigurosa que la estimación frecuentista, los profesionales a menudo optan por técnicas frecuentistas cuando tienen conjuntos de datos "grandes". Esto es cierto incluso cuando el objetivo principal es la predicción en oposición a la estimación / inferencia de parámetros.

Zachary Blumenfeld
fuente

+1 pero con respecto a su ejemplo de regresión (probando el efecto de la educación en los salarios), aunque estoy de acuerdo en que "muchas investigaciones" (¡incluido yo mismo!) Prefiero usar procedimientos frecuentas, hay muchas personas, incluidos los estadísticos, que dicen que esto Todo el enfoque está equivocado y no funciona correctamente o incluso como se pretendía. Este no es un lugar para debatirlo, pero debe mencionarse que este punto de vista también existe.

ameba

@amoeba, casi todos esos argumentos no se refieren a enfoques frecuentistas utilizados propiamente, sino al uso excesivo, mal uso y malentendido de ellos.

John

Zachary, como este hilo está cerrado, ¿te importaría o preferiría que tu respuesta se moviera en stats.stackexchange.com/questions/194035 ? Esto se puede hacer si este hilo se "fusiona" en ese (es decir, se cierra como duplicado y todas las respuestas se mueven). Creo que esto podría ser útil.

ameba

@amoeba seguro, si crees que sería útil.

Zachary Blumenfeld

"No le daré este ejemplo porque tal ejemplo favorecería un enfoque bayesiano a menos que el bayesiano elija un mal antecedente, que es un ejemplo de evasión que realmente no vale la pena escribir". Estoy totalmente en desacuerdo con esto. Esta es la razón fundamental para considerar las estadísticas frecuentistas en primer lugar: es difícil encontrar buenos antecedentes. Los resultados bayesianos son trivialmente mejores con un buen previo, pero obtener un buen previo es muy poco trivial.

Cliff AB

Ejemplos concretos de un enfoque frecuentista que es superior a uno bayesiano [cerrado]

Respuestas: