Intervalos de confianza para un polinomio

8

Tengo una variable aleatoria que toma valores en los enteros no negativos , llama a las probabilidades para cada resultado . Puedo tomar muestras de la distribución de independiente y económica; Actualmente tengo un tamaño de muestra de . Parece que , con una disminución aproximadamente exponencial.Z{0,1,2,}zk:=P[Z=k]Z228z00.24,z10.18,

Tengo una secuencia de formas cuadráticas con coeficientes positivos:

  • Q0(z0)=14z02
  • Q1(z0,z1)=12z0z1
  • ...
  • Q7(z0,z1,,z7)=18(2z0z1+3z2z1+4z4z1+4z6z1+3z0z3+ +4z2z3+4z3z4+4z0z5+4z2z5+4z0z7)
  • ...

Lo que me gustaría tener es un intervalo de confianza para las que tenga menos de ancho, pero tomaré lo que pueda conseguir.Qi104

Tengo límites rigurosos en , y dado que los coeficientes de las son todos positivos, es sencillo convertirlos en límites rigurosos para las 's. Pero no sé cómo hacer esto correctamente con intervalos de confianza.ziQQ


¿De qué se trata esto? Encontré un fenómeno extraño en la teoría de números, y sé cómo demostrar que realmente sucede, pero hacerlo requerirá un esfuerzo de programación de mi parte y una cantidad considerable de tiempo en nuestro clúster local. Antes de invertir ese tiempo y obstruir nuestra máquina, me gustaría estar más seguro de que el fenómeno es real.

Quiero cuantificar la razonabilidad de mi afirmación de que y . Mis estimaciones indican que es de alrededor de , razón por la cual quería CI en esa resolución.Q7<Q6Q7<Q8Q6Q75104

Fije un número entero grande , y deje que sea ​​un subconjunto elegido uniformemente de (es decir, cada subconjunto particular tiene una probabilidad de ser elegido). Sea la probabilidad de que exactamente de los números de no puedan escribirse como la suma de dos elementos de ; deje . Es un poco difícil de probar, pero existen esos límites y . Ahora no sorprende que sea ​​pequeño, y a medida que aumentanA{1,2,,n}2nQk(n)k{2,3,,2n}AQk=limnQk(n)kQk=1Q0kQkaumenta, tiene un pico y luego decae exponencialmente. La parte extraña es que hay un sesgo contra 7. Es decir, experimentalmente y . Es decir, lo que no fue una sorpresa en realidad no es cierto: la distribución es bimodal.Q7<Q6Q7<Q8

Puedo expresar las '(usando alguna teoría) como arriba sin el límite en términos de esta otra distribución, definida por las ' s. Eso es útil porque tengo una manera de vincular rigurosamente los usando, como mencioné anteriormente, algunos cálculos grandes. Además, tengo un conjunto de datos muy grande para la variableQiziziZ

Kevin O'Bryant
fuente
Su inquietud con el lenguaje de los intervalos de confianza, pero con una presentación rigurosa, sugiere que puede estar en una buena posición para darnos un poco más de información para ayudarlo. Normalmente, puede especificar una de dos propiedades de un elemento de configuración: su cobertura o su longitud. El otro estará determinado por los datos. Sin embargo, es inusual estipular la longitud: ¿estás seguro de que esto es lo que quieres? Además, no está claro si necesita CI para las Q por separado o simultáneamente. ¿Quizás podría indicar para qué piensa utilizar estos CI?
whuber

Respuestas:

3

En mi respuesta, proporciono muchos enlaces a material de fondo para ahorrar espacio aquí. Voy a escribir mi respuesta tomando la información en los enlaces como se indica.

Creo que un enfoque bayesiano es un ajuste natural para este problema, especialmente porque solo buscas convencerte a ti mismo. Es un poco complicado usar intervalos de confianza para responder a la pregunta que realmente le interesa, a saber, cuán plausible es que y dada la muestra de distribución? El enfoque bayesiano le permite abordar esta pregunta directamente.Q7<Q6Q7<Q8zi

Función de probabilidad

Sea la frecuencia observada del resultado entero en su muestra y sea el tamaño de la muestra. La función de probabilidad es proporcional a la distribución multinomial . Tiene la formafkkN

L(z0,...z8;f0,...f8)=i=08ziNfi .

Distribución previa

La distribución de Dirichlet es la elección natural para la distribución previa porque es el conjugado anterior para la probabilidad multinomial. Tiene la forma

p(z0,...z8;α0,...,α8)i=08ziαi1

Este anterior tiene nueve hiperparámetros (los valores ), y son un poco difíciles de manejar. En este contexto de "muestra grande", cualquier elección razonable de valores de hiperparámetro tendrá una influencia insignificante en el resultado, pero aun así, creo que vale la pena dedicar un poco de esfuerzo a seleccionar valores razonables.αi

Así es como recomiendo configurar los hiperparámetros. Primero, tenga en cuenta que bajo esta distribución . A continuación, tenga en cuenta que la distribución de entropía máxima más simple sobre los naturales es la distribución geométrica . Así que estableceE(zi)=αii=08αi

αi+1=rαi=riα0,0<r<1,

α0=A(1r1r9).

Entonces , por lo que la distribución de Los valores se centran en una distribución geométrica (truncada). Además, , por lo que el valor de controla la dispersión alrededor de esta expectativa pero no tiene ningún efecto sobre la expectativa sí mismo.E(zi)=ri(1r1r9)ziVar(zi)1(A+1)A

Esta especificación reduce el número de hiperparámetros de los nueve valores de a poco y . Aplazaré la discusión de valores específicos de y por ahora.αirArA

Probabilidad posterior de la propuesta de interés.

La distribución posterior de los valores es la siguiente distribución de Dirichlet:zi

p(z0,...z8|f0,...,f8)i=08ziαi+Nfi1.

Deje que . La probabilidad posterior que le interesa esY={z0,...z8|Q7<Q6 and Q7<Q8}

Pr(Q7<Q6 and Q7<Q8|f0,...,f8)Yi=08ziαi+Nfi1dzi.

Esta integral es intractible, pero puede calcular numéricamente la probabilidad de interés utilizando el siguiente algoritmo de Monte Carlo.

Para de a ,j1J

  1. Muestra un conjunto de valores de su distribución posterior.zi

  2. Use los valores muestreados para calcular donde es la función del indicador.yj=I(Q7<Q6)I(Q7<Q8)I()

Entonces .Pr(Q7<Q6 and Q7<Q8|f0,...,f8)j=0JyjJ

La precisión de la aproximación de Monte Carlo es como : le dará al menos dos decimales de precisión 19 veces de 20, le dará al menos tres lugares decimales de precisión 19 veces de 20, etc.JJ=104J=106

Y si su probabilidad posterior de interés no está cerca de 0 o 1, simplemente muestree más datos, enjuague y repita.

Hiperparámetros anteriores, segunda parte

El exponente de en la expresión para la densidad posterior eszi

αi+Nfi1=Ari(1r1r9)+Nfi1=AE(zi)+Nfi1

Se puede ver que el hiperparámetro juega el mismo papel en la distribución previa que juega en la probabilidad: es una especie de "tamaño de muestra anterior". Para asegurarse de que lo anterior tenga una influencia insignificante en la conclusión, simplemente elija un valor de tal que ; por ejemplo, .ANAANA=1

Para establecer , tenga en cuenta que puede calcular la probabilidad previa de la proposición utilizando el mismo algoritmo de Monte Carlo descrito anteriormente pero con la distribución previa en lugar de la distribución posterior en el paso 1 del lazo. Intente encontrar un valor de que ofrezca una probabilidad previa de 0.5 (o menor, si cree que es más razonable).rQ7<Q6 and Q7<Q8r

Cian
fuente
No, solo me estoy saltando algunos tecnicismos. Un análisis más completo técnicamente comenzaría con un proceso de Dirichlet y luego mostraría que el resultado de marginar el conjunto infinitamente contable de parámetros irrelevantes es la distribución de Dirichlet que doy arriba. zi
Cyan
1

Supongo que z_k no son probabilidades sino frecuencias de muestra. Esto se debe a que, de lo contrario, Q_i (z_0, ..., z_i) no es una variable aleatoria. En ese caso, calcular la varianza de Q_i es álgebra directa. Primero defina los indicadores de evento Z_i, que es 1 si Z == i, 0 de lo contrario. Es una variable aleatoria de Bernoulli con probabilidad p_i. Puede calcular el primer y el segundo momento de cualquiera de estas variables y deben proporcionarle todos los términos necesarios para calcular la varianza de Q_i.

AdamO
fuente
No, los son constantes de la naturaleza y, en consecuencia, también lo son. Es un número real, pero la pregunta es qué número real. Mi muestreo me permite estimar el , y si los a la fórmula que vincula con , obtengo un estimado para (alrededor de ). Pero no entiendo qué tan buena es esa estimación. Si tomo el 99% de CI para cada y los , obtengo un intervalo, pero ¿cuál es el nivel de confianza? Tampoco creo que los CI para sean independientes. ziQ7z^iQ7ziQ70.07zizi
Kevin O'Bryant
La falta de independencia no es una preocupación aquí, Kevin (puede justificar esto analizando la verdadera distribución multinomial de si lo desea). z^i
whuber
Dado que ya puede calcular una estimación para partir de sus datos, ¿qué tal si utiliza alguna técnica de remuestreo como bootstrap para encontrar un IC para ? en.wikipedia.org/wiki/Bootstrapping_(statistics)Q7Q7
Zen
@Zen: había oído hablar de bootstrapping, pero nunca pensé que sería algo que me pasó a mí. En serio, estoy tratando de hacerlo funcionar, pero lleva mucho tiempo volver a muestrear 1000 veces (cada muestreo tiene puntos). Incluso 1000 muestras de tamaño me llevan 2 horas. 228216
Kevin O'Bryant
1

Kevin, ten cuidado ya que tendré que cambiar un poco tu notación: tus no son mis 's.zizi

Creo que vale la pena probar la siguiente solución bayesiana. Cocine un parámetro aleatorio y deje que sea ​​condicionalmente iid, dado , con . Use la notación . Ya tiene una muestra de las 's, con . Defina las variables aleatorias Para (si esto no está claro, échale un vistazo ). Ahora, en esta formulación tus formas cuadráticasΛ>0Z1,,ZnΛ=λZiΛ=λPoisson(λ)Z=(Z1,,Zn)z=(z1,,zn)Zin=228

Θi=P{Zi=kΛ}=eΛΛkk!,
i0Qi=Qi(Θ0,,Θi)=Qi(Λ) son funciones de . Entonces, los son aleatorios y desea determinar la probabilidad posterior Con un , usando el Teorema de Bayes tenemos Usted calcula generando iid partir de la distribución anterior (use R !) Y calculando ΛQi
P{Q7<Q6andQ7<Q8Z=z}.()
ΛGamma(a,b)
ΛZ=zGamma(a+i=1nzi,b+n).
()λi
1Ni=1NI(,Q6(λi))(Q8(λi),)(Q7(λi)),
que converge, por la fuerte ley de los grandes números, a casi con seguridad. Para obtener un "sí" a su pregunta original, esta probabilidad posterior debe ser "lo suficientemente grande". Con una muestra tan grande ( ), creo que es posible jugar con los valores de y para que su elección previa no sea "informativa".()n=228ab
zen
fuente
Esa distribución de Poisson parece una suposición bastante restrictiva, ¿no?
Cyan
Necesitamos una distribución, cuyo soporte sea , que haga posible los cálculos. Veamos qué puede encontrar Kevin con este modelo. Z+
Zen