¿Es un vago anterior lo mismo que un previo no informativo?

27

Esta es una pregunta sobre terminología. ¿Es un "vago previo" lo mismo que un previo no informativo, o hay alguna diferencia entre los dos? Mi impresión es que son iguales (al buscar juntos vagos y no informativos), pero no puedo estar seguro.

bayesiano
fuente
1
Vagamente: sí. Sin información: No.
cardenal

Respuestas:

18

Gelman y col. (2003) dicen:

Durante mucho tiempo ha existido el deseo de distribuciones previas que puedan garantizar un papel mínimo en la distribución posterior. Tales distribuciones a veces se denominan 'distribuciones previas de referencia' y la densidad previa se describe como vaga, plana o no informativa . [Énfasis del texto original]

Basado en mi lectura de la discusión sobre el previo de Jeffreys en Gelman et al. (2003, p.62ff, no hay consenso sobre la existencia de un previo verdaderamente no informativo, y que los previos suficientemente vagos / planos / difusos son suficientes.

Algunos de los puntos que hacen:

  1. Cualquier previo incluye información, incluidos los anteriores que indican que no se conoce información.
    • Por ejemplo, si sabemos que no sabemos nada sobre el parámetro en cuestión, entonces sabemos algo al respecto.
  2. En la mayoría de los contextos aplicados, no existe una ventaja clara para un prior verdaderamente no informativo cuando bastan suficientes antecedentes vagos, y en muchos casos hay ventajas, como encontrar un previo adecuado, al uso de una parametrización vaga de un conjugado previo.
  3. El principio de Jeffreys puede ser útil para construir antecedentes que minimicen el contenido de información de Fisher en modelos univariados, pero no existe un análogo para el caso multivariante
  4. Al comparar modelos, el previo de Jeffreys variará con la distribución de la probabilidad, por lo que los anteriores también tendrían que cambiar
  5. En general, ha habido mucho debate sobre si existe un previo no informativo (debido a 1, pero también vea la discusión y las referencias en p.66 en Gelman et al. para la historia de este debate).

tenga en cuenta que esto es wiki de la comunidad: la teoría subyacente está en los límites de mi comprensión, y agradecería las contribuciones a esta respuesta.

Gelman y col. Análisis de datos bayesianos 2003, Chapman y Hall / CRC

David
fuente
1
El propio Gelman ha ido más allá de los antecedentes "no informativos", véase, por ejemplo, stat.columbia.edu/~cook/movabletype/archives/2007/07/… y el documento al que hago referencia en mi respuesta, y otros trabajos suyos. Esta actitud parece cada vez más frecuente entre los estadísticos aplicados.
JMS
@JMS Gelman et. Alabama. 2003 hizo este punto, y he tratado de resumirlo, parecen considerar los antecedentes no informativos para fines de fondo / teóricos / heurísticos
David LeBauer
Sí, un libro de texto sobre estadísticas bayesianas ciertamente no puede ignorarlas. Solo quise agregar que la tendencia en las estadísticas aplicadas desde entonces ha sido alejarse de estas opciones tradicionales, aunque el trabajo continúa en "Bayes objetivo"
JMS
Creo que las personas tienden a usar la información de dos maneras cuando describen los antecedentes, en un sentido informal y en un sentido teórico de la información. Por lo tanto, podría crear una entropía máxima previa que contenga la menor información posible, en un sentido teórico de la información. Usando esta distribución usted (podría) señalar que "no sabe nada sobre el parámetro", esto podría ser bastante informativo en un sentido más informal ...
Rasmus Bååth
9

Definitivamente no, aunque con frecuencia se usan indistintamente. Un vago previo (relativamente desinformado, que no favorece realmente algunos valores sobre otros) en un parámetro puede inducir un previo muy informativo sobre alguna otra transformación f ( θ ) . Esto es al menos parte de la motivación para el previo de Jeffreys, que inicialmente se construyó para ser lo menos informativo posible.θF(θ)

Los antecedentes vagos también pueden hacerle algunas cosas bastante miserables a su modelo. El ejemplo ahora clásico está usando como ϵ 0 anteriores en componentes de varianza en un modelo jerárquico.yonortevmirsmisolunametrometrouna(ϵ,ϵ)ϵ0 0

ϵR+

Editar: @csgillespie (¡con razón!) Señala que no he respondido completamente a su pregunta. En mi opinión, un prior no informativo es uno que es vago en el sentido de que no favorece particularmente un área del espacio de parámetros sobre otra, pero al hacerlo no debería inducir previos informativos sobre otros parámetros. Entonces, un prior no informativo es vago, pero un prior vago no es necesariamente no informativo. Un ejemplo donde esto entra en juego es la selección de variables bayesianas; ¡un "vago" previo sobre las probabilidades de inclusión de variables puede inducir un previo bastante informativo sobre el número total de variables incluidas en el modelo!

Me parece que la búsqueda de antecedentes verdaderamente no informativos es quijotesca (aunque muchos estarían en desacuerdo); es mejor usar los llamados antecedentes informativos "débilmente" (que, supongo, generalmente son vagos en algún sentido). Realmente, ¿con qué frecuencia no sabemos nada sobre el parámetro en cuestión?

JMS
fuente
Su respuesta es muy buena, pero en realidad no declara qué es un "previo no informativo" y cómo se diferencia de un "previo vago";)
csgillespie
@cgillespie: Tienes razón, editado :)
JMS
siguiendo su último párrafo y apoyando la naturaleza quijotesca de la búsqueda: si sabemos que no sabemos nada sobre el parámetro en cuestión, entonces sabemos algo al respecto.
David LeBauer
¡Bastante! La gran ironía es que muchos de los que gastan tanta energía estrujando las manos sobre su elección previa no piensan dos veces antes de descartar la probabilidad. Una probabilidad mal especificada es mucho más propensa a causar problemas, en general. Pero esa es otra pregunta completamente ...
JMS
5

Lambert et al (2005) plantean la pregunta "¿Qué tan vago es vago? Un estudio de simulación del impacto del uso de distribuciones anteriores vagas en MCMC usando WinBUGS ". Escriben: "No abogamos por el uso del término distribución previa no informativa, ya que consideramos que todos los anteriores aportan información". Tiendo a estar de acuerdo, pero definitivamente no soy un experto en estadísticas bayesianas.

Bernd Weiss
fuente
2
Eso concuerda con mi creencia previa subjetiva de que no existe tal cosa como un previo no informativo.
parada
@onestop favor considere contribuir a mi respuesta CW
David LeBauer
yosol(ϵ,ϵ)ϵ0 0
3

Sospecho que "previo vago" se usa para referirse a un previo que se sabe que codifica una cantidad pequeña, pero no nula, de conocimiento sobre el valor verdadero de un parámetro, mientras que un "previo no informativo" se usaría para significar ignorancia completa con respecto al valor de ese parámetro. Quizás se usaría para mostrar que el análisis no fue completamente objetivo.

Por ejemplo, un Gaussiano muy amplio podría ser un vago previo para un parámetro donde un previo no informativo sería uniforme. El gaussiano sería casi plano en la escala de interés, pero, sin embargo, favorecería un valor particular un poco más que cualquier otro (pero podría hacer que el problema sea más manejable matemáticamente).

Dikran Marsupial
fuente
Esto plantea la pregunta de si el uniforme sería realmente no informativo. ¿Cuál sería el máximo y mínimo del uniforme no informativo? ¿Lo anterior no sería informativo después de la transformación a otra escala?
David LeBauer
1
Los antecedentes uniformes no son necesariamente informativos y viceversa, depende de la naturaleza del problema. Creo que la idea de un previo mínimamente informativo es a menudo más realista, usando MAXENT y grupos de transformación para decidir sobre una distribución previa que transmita la cantidad mínima de información consistente con las restricciones conocidas (por ejemplo, que el previo debería ser invariante para el escalado). Para muchos problemas, los antecedentes inadecuados funcionan bien, por lo que no es necesariamente necesario que haya un mínimo y un máximo bien definidos.
Dikran Marsupial
2

Los antecedentes no informativos tienen diferentes formas. Estas formas incluyen antecedentes vagos y previos impropios. Por lo tanto, un vago prior es parte de anteriores no informativos

usuario26652
fuente