Deje , , ..., ser iid RV's con rango pero distribución desconocida. (Estoy de acuerdo con suponer que la distribución es continua, etc., si es necesario).
Defina .
Me dan y pregunto: ¿Qué puedo inferir, de manera bayesiana, acerca de ?
Es decir, se me da la suma de una muestra de tamaño de los RV, y me gustaría saber qué puedo inferir sobre la distribución de la suma de todos los RV, utilizando un enfoque bayesiano (y suponiendo antecedentes razonables sobre el distribución).
Si el soporte fuera lugar de , entonces este problema está bien estudiado y (con antecedentes uniformes) obtienes distribuciones de compuestos beta-binomiales para la distribución inferida en . Pero no estoy seguro de cómo abordarlo con como rango ...
Divulgación completa : ya publiqué esto en MathOverflow , pero me dijeron que sería mejor publicarlo aquí, así que esta es una nueva publicación.
Respuestas:
Considere el siguiente análisis bayesiano no paramétrico.
Defina y deje que sean los subconjuntos Borel de . Sea una medida finita distinta de cero .X= [ 0 , 1 ] si X α ( X, B)
Sea un proceso de Dirichlet con el parámetro , y suponga que son condicionalmente iid, dado que , de modo que , por cada .Q α X1, ... ,Xnorte Q = q μX1( B ) = P{X1∈ B } = q( B ) B ∈ B
Por las propiedades del proceso de Dirichlet, sabemos que, dados , la distribución predictiva de una observación futura como es la medida sobre definido porX1, ... ,Xk Xk + 1 β ( X, B)
Ahora, defina como el campo sigma generado por , y use la mensurabilidad y la simetría de los 's para obtener casi con seguridad.Fk X1, ... ,Xk Xyo
Para encontrar una respuesta explícita, suponga que es . Al definir , tenemos casi seguramente (la distribución conjunta de ), donde . En el límite "no informativo" de , la expectativa anterior se reduce a , lo que significa que, en este caso, su suposición posterior de es solo veces la media de la primeraα ( ⋅ ) / α ( X) U[ 0 , 1 ] c = α ( X) > 0
fuente
Perdone la falta de teoría de la medida y los abusos de notación en el siguiente ...
Como se trata de inferencia bayesiana, debe haber algo anterior sobre lo desconocido en el problema, que en este caso es la distribución de , un parámetro de dimensión infinita que toma valores en el conjunto de distribuciones en (llámelo ). La distribución de datos converge a una distribución normal, por lo que si es lo suficientemente grande ( teorema de Berry-Esseen ) podemos simplemente aplicar esa normalidad como una aproximación. Además, si la aproximación es precisa, el único aspecto del que importa en términos prácticos es el previo inducido en .X1 [0,1] π Sk|π k p(π) (Eπ(X1),Varπ(X1))=(μ,σ2)
Ahora hacemos predicciones bayesianas estándar y ponemos las densidades aproximadas. ( está sujeto a la misma aproximación que .)Sn Sk
Para los límites de la integral, , obviamente; Creo que ?μ∈[0,1] σ2∈[0,14]
Más adelante: no,Esto es bueno: los valores permitidos de dependen de , por lo que la información en los datos sobre es relevante para .σ2∈[0,μ(1−μ)]. σ2 μ μ σ2
fuente
Deje que cada pertenezca a la familia de distribución y tenga parámetros .Xi F θ
Dado, , tenemos una distribución en :Sk θ
Y, nuestra distribución en , esSn n≥k
(y de manera similar para )n<k
Ambas ecuaciones tienen formas agradables cuando es una distribución en la familia exponencial que se cierra bajo la suma de elementos iid como la distribución normal, la distribución gamma y la distribución binomial. También funciona para sus casos especiales como la distribución exponencial y la distribución de Bernoulli.F
Puede ser interesante considerar que es la familia de distribuciones binomiales escaladas (por ) con conocidos "ensayos" , y tomando el límite a medida que va al infinito.F 1n n n
fuente