Para un problema de inferencia dado, sabemos que un enfoque bayesiano generalmente difiere tanto en la forma como en los resultados de un enfoque fequentista. Los frecuentes (por lo general me incluyen a mí) a menudo señalan que sus métodos no requieren un previo y, por lo tanto, están más "basados en datos" que "basados en el juicio". Por supuesto, Bayesian puede señalar antecedentes no informativos o, siendo pragmáticos, simplemente usar un previo realmente difuso.
Mi preocupación, especialmente después de sentir una pizca de satisfacción con mi objetividad fequentista, es que quizás mis métodos supuestamente "objetivos" puedan formularse en un marco bayesiano, aunque con algún modelo inusual de datos y anteriores. En ese caso, ¿estoy simplemente felizmente ignorante del absurdo anterior y modelo que implica mi método frecuentista ?
Si un bayesiano señalara tal formulación, creo que mi primera reacción sería decir "Bueno, eso es bueno que puedas hacer eso, ¡pero no es así como pienso en el problema!". Sin embargo, a quién le importa cómo lo pienso , o cómo lo formulo. Si mi procedimiento es estadísticamente / matemáticamente equivalente a algún modelo bayesiano, entonces estoy implícitamente ( ¡ inconscientemente !) Realizando inferencia bayesiana.
Pregunta real a continuación
Esta realización socava sustancialmente cualquier tentación de ser presumido. Sin embargo, no estoy seguro de si es cierto que el paradigma bayesiano puede acomodar todos los procedimientos frecuentistas (una vez más, siempre que el bayesiano elija un previo y una probabilidad adecuados) . Sé que lo contrario es falso.
Pregunto esto porque recientemente publiqué una pregunta sobre inferencia condicional, que me llevó al siguiente documento: aquí (ver 3.9.5,3.9.6)
Señalan el conocido resultado de Basu de que puede haber más de una estadística auxiliar, lo que plantea la pregunta de qué "subconjunto relevante" es más relevante. Peor aún, muestran dos ejemplos de dónde, incluso si tiene una estadística auxiliar única, no elimina la presencia de otros subconjuntos relevantes.
Continúan concluyendo que solo los métodos bayesianos (o métodos equivalentes a ellos) pueden evitar este problema, permitiendo la inferencia condicional sin problemas.
Puede que no sea el caso de las Estadísticas Bayesianas Estadísticas Fequentistas - esa es mi pregunta para este grupo aquí. Pero parece que una elección fundamental entre los dos paradigmas radica menos en la filosofía que en los objetivos: ¿necesita una alta precisión condicional o un bajo error incondicional ?
La alta precisión condicional parece aplicable cuando tenemos que analizar una instancia singular: queremos tener razón para ESTA inferencia particular, a pesar de que este método puede no ser apropiado o preciso para el próximo conjunto de datos (hipercondicionalidad / especialización).
Un error incondicional bajo es apropiado cuando estamos dispuestos a hacer inferencias condicionalmente incorrectas en algunos casos, siempre y cuando nuestro error a largo plazo se minimice o controle. Honestamente, después de escribir esto, no estoy seguro de por qué querría esto a menos que estuviera atado por el tiempo y no pudiera hacer un análisis bayesiano ... hmmm.
Tiendo a favorecer la inferencia fequentista basada en la probabilidad, ya que obtengo alguna condicionalidad (asintótica / aproximada) de la función de probabilidad, pero no necesito jugar con un previo; sin embargo, me siento cada vez más cómodo con la inferencia bayesiana, especialmente si Veo el término aa de regularización anterior para inferencia de muestra pequeña.
Perdón por el lado. Cualquier ayuda para mi problema principal es apreciada.
Respuestas:
Yo diría que los frecuentistas son a menudo "bayesianos implícitos / inconscientes", ya que en la práctica a menudo queremos realizar razonamientos probabilísticos sobre cosas que no tienen una frecuencia a largo plazo. El ejemplo clásico es la prueba estadística de hipótesis nula (NHST), donde lo que realmente queremos saber es que las probabilidades relativas de las hipótesis nula y de investigación son ciertas, pero no podemos hacer esto en un contexto frecuentista ya que la verdad de una hipótesis particular no tiene (no trivial) frecuencia a largo plazo: es cierto o no lo es. Los NHST frecuentes evitan esto al sustituir una pregunta diferente, "¿cuál es la probabilidad de observar un resultado al menos tan extremo bajo la hipótesis nula" y luego compararlo con un umbral predeterminado. Sin embargo, este procedimiento no es lógico permítanos concluir cualquier cosa acerca de si H0 o H1 es cierto, y al hacerlo, en realidad estamos saliendo de un marco frecuentista en uno bayesiano (generalmente subjetivo), donde concluimos que la probabilidad de observar un valor tan extremo bajo H0 es tan bajo que ya no podemos creer que es probable que H0 sea cierto (tenga en cuenta que esto implícitamente asigna una probabilidad a una hipótesis particular).
Podría decirse que los intervalos de confianza a menudo se usan (e interpretan como) un intervalo en el que podemos esperar ver las observaciones con una probabilidad dada, lo que nuevamente es una interpretación bayesiana.
Idealmente, los estadísticos deberían ser conscientes de los beneficios y desventajas de ambos enfoques y estar preparados para utilizar el marco adecuado para la aplicación en cuestión. Básicamente, deberíamos apuntar a utilizar el análisis que proporcione la respuesta más directa a la pregunta que realmente queremos que se responda (y no sustituir silenciosamente una diferente), por lo que un enfoque frecuentista es probablemente el más eficiente cuando realmente estamos interesados en frecuencias de largo plazo y Métodos bayesianos donde ese no es el caso.
fuente
Los bayesianos y los frequentistas no solo difieren en la forma en que obtienen inferencias, o en qué tan similares o diferentes pueden ser inciertas ciertas elecciones previas. La principal diferencia es cómo interpretan la probabilidad:
Probabilidad bayesiana :
Probabilidad Frequentist :
Estas dos definiciones representan dos enfoques irreconciliables para definir el concepto de probabilidad (al menos hasta ahora). Por lo tanto, existen diferencias más fundamentales entre estas dos áreas que si se pueden obtener estimadores similares o las mismas conclusiones en algunos modelos paramétricos o no paramétricos.
fuente