Calcular el cuantil de la suma de distribuciones de cuantiles particulares

9

Supongamos N variables aleatorias independientes para las cuales los cuantiles en algún nivel específico se conocen a través de la estimación de los datos: , ..., . Ahora definamos la variable aleatoria como la suma . ¿Hay alguna manera de calcular el valor del cuantil de la suma en el nivel , es decir, en ?X1,...,XNαα=P(X1<q1)α=P(XN<qN)ZZ=i=1NXiαqzα=P(Z<qZ)

Creo que en casos particulares, como si sigue una distribución gaussiana esto, es fácil, pero no estoy tan seguro para el caso en el que se desconoce la distribución de . ¿Algunas ideas?XiiXi

albarji
fuente
1
¿Son estos qi estimé a partir de datos o teóricamente conocidos?
chuse
Esto no es posible sin hacer suposiciones específicas sobre las distribuciones de Xi . ¿Tienes una familia de distribuciones en mente?
whuber
@chuse los qi se estiman a partir de los datos, ya que no se conoce la distribución de Xi pero hay muestras disponibles. He actualizado la pregunta con este hecho.
albarji
@whuber no tengo ningún conocimiento previo acerca de la familia de distribuciones de la podría estar siguiendo, aunque las muestras de datos están disponibles. ¿Asumir una familia de distribuciones (aparte de Gauss) facilitaría esto? Xi
albarji

Respuestas:

4

podría ser cualquier cosa.qZ


Para comprender esta situación, hagamos una simplificación preliminar. Al trabajar con obtenemos una caracterización más uniformeYi=Xiqi

α=Pr(Xiqi)=Pr(Yi0).

Es decir, cada tiene la misma probabilidad de ser negativo. PorqueYi

W=iYi=iXiiqi=Ziqi,

la ecuación definitoria para es equivalente aqZ

α=Pr(ZqZ)=Pr(ZiqiqZiqi)=Pr(WqW)

con .qZ=qW+iqi


¿Cuáles son los valores posibles de ? Considere el caso donde todos tienen la misma distribución con toda probabilidad en dos valores, uno de ellos negativo ( ) y el otro positivo ( ). Los posibles valores de la suma están limitados a para . Cada uno de estos ocurre con probabilidadY i y - y + W k y - + ( n - k ) y + k = 0 , 1 , , nqWYiyy+Wky+(nk)y+k=0,1,,n

PrW(ky+(nk)y+)=(nk)αk(1α)nk.

Los extremos se pueden encontrar por

  1. Elegir e para que ; e lograrán esto. Esto garantiza que será negativo, excepto cuando todos los sean positivos. Esta posibilidad es igual a . Supera cuando , lo que implica que el cuantil de debe ser estrictamente negativo. y +yy+y - = - n y + = 1 W Y i 1 - ( 1 - α ) n α n > 1 α Wy+(n1)y+<0y=ny+=1WYi1(1α)nαn>1αW

  2. Elegir e para que ; e lograrán esto. Esto garantiza que será negativo solo cuando todos los sean negativos. Esta posibilidad es igual a . Es menor que cuando , lo que implica que el cuantil de debe ser estrictamente positivo. y + ( n - 1 ) y - + y + > 0 y - = - 1 y + = n W Y i α n α n > 1 α Wyy+(n1)y+y+>0y=1y+=nWYiαnαn>1αW

Esto muestra que el cuantil de podría ser negativo o positivo, pero no es cero. ¿Cuál podría ser su tamaño? Tiene que igualar alguna combinación lineal integral de e . Hacer que estos valores sean enteros asegura que todos los valores posibles de sean integrales. Al escalar por un número positivo arbitrario , podemos garantizar que todas las combinaciones lineales integrales de e son múltiplos integrales de . Como , debe tener al menos tamaño de . Por consiguiente,W y - y + W y ± s y - y + s q W0 s q WαWyy+Wy±syy+sqW0sLos posibles valores de (y de donde ) son ilimitados,qWqZ sin importar lo que pueda ser igual.n>1


La única forma de obtener información sobre sería hacer restricciones específicas y fuertes sobre las distribuciones de , para prevenir y limitar el tipo de distribuciones desequilibradas que se utilizan para obtener este resultado negativo.X iqZXi

whuber
fuente
Muchas gracias @whuber, por la explicación y el ejemplo ilustrativo. Aunque la respuesta es negativa, no puedo decir que esto fue inesperado. Luego intentaré averiguar qué familia de distribuciones se adapta a mis datos y ver si con eso puedo calcular los cuantiles de la suma.
albarji