Si doy dos cuantiles y sus ubicaciones correspondientes (cada uno) en el intervalo abierto , ¿siempre puedo encontrar parámetros de una distribución beta que tenga esos cuantiles en las ubicaciones especificadas?
9
Si doy dos cuantiles y sus ubicaciones correspondientes (cada uno) en el intervalo abierto , ¿siempre puedo encontrar parámetros de una distribución beta que tenga esos cuantiles en las ubicaciones especificadas?
Respuestas:
La respuesta es sí, siempre que los datos satisfagan los requisitos de coherencia obvios. El argumento es sencillo, basado en una construcción simple, pero requiere cierta configuración. Se reduce a un hecho intuitivamente atractiva: incrementar el parámetro de en una Beta distribución aumenta el valor de su densidad (PDF) más para grandes que más pequeños ; y aumentar hace lo contrario: cuanto menor es , más aumenta el valor del PDF.a (a,b) x x b x
Los detalles siguen.
La dificultad para demostrar esto es que la distribución Beta implica una constante de normalización recalcitrante. Recuerde la definición: para y , la distribución Beta tiene una función de densidad (PDF)a>0 b>0 (a,b)
La constante de normalización es la función Beta.
Todo se vuelve desordenado si tratamos de diferenciar directamente con respecto a y , que sería la forma de fuerza bruta para intentar una demostración.f(x;a,b) a b
Una forma de evitar tener que analizar la función Beta es notar que los cuantiles son áreas relativas . Es decir,
para . Aquí, por ejemplo, están el PDF y la función de distribución acumulativa (CDF) de una distribución Beta para la cual y .i=1,2 F (1.15,0.57) x1=1/3 q1=1/6
La función de densidad se representa a la izquierda. es el área debajo de la curva a la izquierda de , que se muestra en rojo, en relación con el área total debajo de la curva. es el área a la izquierda de , igual a la suma de las regiones roja y azul, nuevamente en relación con el área total . El CDF de la derecha muestra cómo y marcan dos puntos distintos en él.x→f(x;a,b) q1 x 1 q 2 x 2 ( x 1 , q 1 ) ( x 2 , q 2 )x1 q2 x2 (x1,q1) (x2,q2)
En esta figura, se establece en , fue seleccionado para ser , y luego un valor de se encontró para los que se encuentra en la Beta CDF.(x1,q1) (1/3,1/6) a 1.15 b (x1,q1) (a,b)
Lema : Tal siempre se puede encontrar.b
Para ser específico, deje que una vez por todas. (Se mantienen igual en las siguientes ilustraciones: en los tres casos, el área relativa a la izquierda de es igual a .) Para cualquier , el Lema afirma que hay un valor único de , escrito para el cual es el cuantil de la distribución Beta .(x1,q1) x1 q1 a>0 b b(a), x1 q1 (a,b(a))
Para ver por qué, observe primero que cuando aproxima a cero, toda la probabilidad se acumula cerca de los valores de , de donde aproxima a . Cuando acerca al infinito, toda la probabilidad se acumula cerca de los valores de , de donde aproxima a . En el medio, la función aumenta estrictamente en .b 0 F(x1;a,b) 1 b 1 F(x1;a,b) 0 b→F(x1;a,b) b
Esta afirmación es geométricamente obvia: equivale a decir que si miramos el área a la izquierda debajo de la curva relación con el área total debajo la curva y compárelo con el área relativa debajo de la curva para , entonces la última área es relativamente más grande La relación de estas dos funciones es . Esta es una función igual a cuando cayendo constantemente a cuando Por lo tanto, las alturas de la función son relativamente más grandesx→xa−1(1−x)b−1 x→xa−1(1−x)b′−1 b′>b (1−x)b′−b 1 x=0, 0 x=1. x→f(x;a,b′) que las alturas de para a la izquierda de de lo que son para a la derecha de En consecuencia, el área a la izquierda de en el primero debe ser relativamente más grande que el área a la derecha de (Esto es fácil de traducir en un argumento riguroso usando una suma de Riemann, por ejemplo).x→f(x;a,b) x x1 x x1. x1 x1.
Hemos visto que la función aumenta estrictamente monotónicamente con valores limitantes en y como y respectivamente. También es (claramente) continuo. En consecuencia, existe un número donde y ese número es único, lo que demuestra el lema.b→f(x1;a,b) 0 1 b→0 b→∞, b(a) f(x1;a,b(a))=q1
El mismo argumento muestra que a medida que aumenta, el área a la izquierda de aumenta.b x2 Por consiguiente, los valores de rango sobre un cierto intervalo de números como progresa desde casi a casi El límite de como esf(x2;a,b(a)) a 0 ∞. f(x2;a,b(a)) a→0 q1.
Aquí hay un ejemplo donde está cerca de (es igual a ). Con y (como en la figura anterior), Casi no hay área entre ya 0 0.1 x1=1/3 q1=1/6 b(a)≈0.02. x1 x2:
El CDF es prácticamente plano entre y donde está prácticamente encima de En el límite como ,x1 x2, q2 q1. a→0 q2→q1.
En el otro extremo, valores suficientemente grandes de derivación a arbitrariamente cerca de Aquí hay un ejemplo con como antes.a F(x2;a,b(a)) 1. (x1,q1)
Aquí y es casi Ahora es esencialmente no hay casi ninguna área a la derecha dea=8 b(a) 10. F(x2;a,b(a)) 1: x2.
En consecuencia, puede seleccionar cualquier entre y y ajustar hasta Al igual que antes, esto debe ser único, QED .q2 q1 1 a F(x2;a,a(b))=q2. a
Elα β .
R
código de trabajo para encontrar soluciones se publica en Determinación de los parámetros de distribución beta y desde dos puntos arbitrarios (cuantiles)βfuente