Conozco 3 métodos para hacer estimaciones de parámetros, ML, MAP y enfoque de Bayes. Y para el enfoque de MAP y Bayes, tenemos que elegir prioridades para los parámetros, ¿verdad?
Digamos que tengo este modelo , en el que son parámetros, para hacer la estimación utilizando MAP o Bayes, leí en el libro que sería mejor elegir un conjugado antes de , que es una probabilidad conjunta de , ¿verdad?p ( α , β ) α , β
Tengo 2 preguntas:
¿Tenemos otras opciones para elegir el anterior además de este conjugado?
¿Podemos elegir priors para y respectivamente como y , además de juntarlos en uno?β p ( α ) p ( β )
bayesian
estimation
prior
aguacate
fuente
fuente
Respuestas:
Como se indicó en el comentario, la distribución previa representa creencias previas sobre la distribución de los parámetros.
Cuando las creencias anteriores están realmente disponibles, puedes:
Cuando no hay creencias previas explícitas disponibles, puede:
Dicho esto, no hay restricción para usar una articulación o un previo independiente ( Vs p ( a ) ⋅ p ( b ) ). Como complemento, diría que, en mi humilde opinión, hay tres cosas importantes a tener en cuenta al elegir un previo:p ( a , b ) p ( a ) ⋅ p ( b )
fuente
También hay Bayes empíricos. La idea es ajustar lo anterior a los datos:
Si bien esto puede parecer incómodo al principio, en realidad hay relaciones con la longitud mínima de descripción. Esta es también la forma típica de estimar los parámetros del núcleo de los procesos gaussianos.
fuente
Para responder las dos preguntas anteriores directamente:
Tiene otras opciones para elegir prioritarios no conjugados que no sean prioritarios conjugados. El problema es que si elige anteriores no conjugados, no puede hacer una inferencia bayesiana exacta (en pocas palabras, no puede derivar una posterior de forma cerrada). Por el contrario, debe hacer una inferencia aproximada o utilizar métodos de muestreo como el muestreo de Gibbs, el muestreo de rechazo, MCMC, etc. para derivarlo posteriormente. El problema con los métodos de muestreo es que, intuitivamente, es como dibujar un elefante en la oscuridad tocándolo repetidamente, puede ser parcial e incompleto. La razón por la que las personas eligen no conjugado previo es que, con cierta probabilidad, la opción de conjugado previo es bastante limitada, o lo que es lo mismo, la mayoría no lo son.
Sí, definitivamente puedes. Si α y β son independientes, que es la condición idealista, puede derivar su distribución conjunta por p (α) p (β). Si no son independientes, es posible que necesite calcular la probabilidad condicional y hacer integral para derivar la distribución conjunta.
fuente