Tenemos N muestras, , de una distribución uniforme donde es desconocido. Estima partir de los datos.
Entonces, la regla de Bayes ...
y la probabilidad es:
(editar: cuandopara todo, y 0 de lo contrario, gracias whuber)
pero sin otra información sobre , parece que lo anterior debería ser proporcional a (es decir, uniforme) o a (¿Jeffreys antes?) Enpero luego mis integrales no convergen, y no estoy seguro de cómo proceder. ¿Algunas ideas?
Respuestas:
Esto ha generado un debate interesante, pero tenga en cuenta que realmente no hace mucha diferencia a la pregunta de interés. Personalmente, creo que debido a que es un parámetro de escala, el argumento del grupo de transformación es apropiado, lo que lleva a un previo deθ
Esta distribución tiene la misma forma al reescalar el problema (la probabilidad también sigue siendo "invariante" al reescalar). El núcleo de este anterior, puede obtenerse resolviendo la ecuación funcional . Los valores dependen del problema, y realmente solo importan si el tamaño de la muestra es muy pequeño (como 1 o 2). El posterior es un pareto truncado, dado por:f(y)=y−1 af(ay)=f(y) L,U
Pero ahora supongamos que usamos un prior más general, dado por (tenga en cuenta que mantenemos los límites para garantizar que todo sea correcto; entonces no hay matemática singular) ) El posterior es el mismo que el anterior, pero con reemplazado por , siempre que . Repitiendo los cálculos anteriores, tenemos la media posterior simplificada dep(θ|cI)∝θ−c−1 L,U N c+N c+N≥0
Entonces el uniforme anterior ( ) dará una estimación de siempre que (la media es infinita para ). Esto muestra que el debate aquí es un poco como si se usa o no o como divisor en la estimación de la varianza.c=−1 N−1N−2X(N) N≥2 N=2 N N−1
Un argumento en contra del uso del uniforme incorrecto previo en este caso es que el posterior es incorrecto cuando , ya que es proporcional a . Pero esto solo importa si o es muy pequeño.N=1 θ−1 N=1
fuente
Dado que el propósito aquí es presumiblemente obtener una estimación válida y útil de , la distribución previa debe ser coherente con la especificación de la distribución de la población de la que proviene la muestra. Esto NO significa de ninguna manera que "calculemos" el uso previo de la muestra en sí; esto anularía la validez de todo el procedimiento. Sí sabemos que la población de la que proviene la muestra es una población de variables aleatorias uniformes iid, cada una de las cuales varía en . Esta es una suposición mantenida y es parte de la información previa que poseemos (y no tiene nada que ver con la muestra , es decir, con la realización específica de un subconjunto de estas variables aleatorias).θ [0,θ]
Ahora suponga que esta población consta de variables aleatorias (mientras que nuestra muestra consta de realizaciones de variables aleatorias). La suposición mantenida nos dice quem n<m n
Denote para compacidad . Luego tenemos que también se puede escribirmaxi=1,...,n{Xi}≡X∗ θ≥X∗
La función de densidad del de iid Uniform rv que varía en esmax N [0,θ]
para el soporte y cero en otro lugar. Luego, usando y aplicando la fórmula de cambio de variable, obtenemos una distribución previa de que es consistente con el supuesto mantenido:[0,θ] θ=cX∗ θ
lo cual puede ser incorrecto si no especificamos la constante adecuadamente. Pero nuestro interés radica en tener un posterior apropiado para , y también, no queremos restringir los posibles valores de (más allá de la restricción implícita en el supuesto mantenido). Entonces dejamos indeterminado. Luego escribiendo el posterior esc θ θ c
X={x1,..,xn}
para alguna constante de normalización A. Queremos
Inserción en la parte posterior
Tenga en cuenta que la constante indeterminada de la distribución anterior se ha cancelado convenientemente.c
La parte posterior resume toda la información que la muestra específica puede darnos con respecto al valor de . Si queremos obtener un valor específico para , podemos calcular fácilmente el valor esperado de la parte posterior,θ θ
¿Hay alguna intuición en este resultado? Bueno, a medida que aumenta el número de , lo más probable es que la realización máxima entre ellos sea cada vez más cercana a su límite superior, , que es exactamente lo que refleja el valor medio posterior de : si, por ejemplo , , pero si . Esto muestra que nuestra táctica con respecto a la selección de lo anterior fue razonable y consistente con el problema en cuestión, pero no necesariamente "óptima" en algún sentido.X θ θ N=2⇒E(θ∣X)=2x∗ N=10⇒E(θ∣X)=109x∗
fuente
Teorema de distribución previa uniforme (caso de intervalo):
"Si la totalidad de Su información sobre externa a los datos es capturada por la proposición única entonces Su única especificación previa posible lógicamente internamente consistente esθ D
Por lo tanto, su especificación previa debe corresponder con la anterior de Jeffrey si realmente cree en el teorema anterior ".
No forma parte del teorema uniforme de distribución previa:
Alternativamente, puede especificar su distribución anterior como una distribución de Pareto, que es la distribución conjugada para el uniforme, sabiendo que su distribución posterior tendrá que ser otra distribución uniforme por conjugación. Sin embargo, si utiliza la distribución de Pareto, deberá especificar los parámetros de la distribución de Pareto de alguna forma.f(θ)
fuente