He estado mirando una pregunta de aumento de datos de MCMC; La forma general de la pregunta es la siguiente:
Suponga que los datos recopilados en un proceso sugieren y se sugiere un parámetro anterior para la tasa como . Los datos se registran y presentan en una forma típica (es decir, el número de ocurrencias de cada valor para de a ), sin embargo, los datos recopilados no discriminan en los casos en que (es decir todas las ocurrencias donde y se agrupan en una categoría).
Dada la información, la probabilidad y lo descrito anteriormente, la pregunta pide:
La forma posterior de ,
El número de ocurrencias donde .
No estoy realmente seguro de cómo responder a esta pregunta, pero soy consciente de que Gibbs Sampling se puede utilizar en el aumento de datos. ¿Alguien tiene alguna información sobre cómo se podría hacer esto?
EDITAR:
Debo especificar que es principalmente la segunda parte (el número de ocurrencias donde ) de lo que no estoy seguro. Para la primera parte (la forma posterior de), dada la probabilidad y lo sugerido anteriormente, he razonado (aunque estoy feliz de que me corrijan):
Dado:
Entonces, para el modelo dado anteriormente:
Simplificando los rendimientos:
que es proporcional a (y, por lo tanto, la forma posterior viene dada por):
fuente