De las lecturas sobre distribuciones de cola larga y pesada, entendí que todas las distribuciones de cola larga son de cola pesada , pero no todas las distribuciones de cola larga son de cola larga .
¿Podría alguien proporcionar un ejemplo de:
- una función continua, simétrica, de densidad media cero que es de cola larga
- una función continua, simétrica, de densidad media cero que es de cola gruesa pero no de cola larga
para poder entender mejor el significado de sus definiciones?
Sería aún mejor si ambos pudieran tener una variación de unidad.
distributions
heavy-tailed
toliveira
fuente
fuente
Respuestas:
Las dos definiciones son cercanas, pero no exactamente iguales. Una diferencia radica en la necesidad de que la tasa de supervivencia tenga un límite.
Para la mayor parte de esta respuesta, ignoraré los criterios para que la distribución sea continua, simétrica y de varianza finita, porque estos son fáciles de lograr una vez que hayamos encontrado cualquier distribución de cola pesada de varianza finita que no sea de cola larga.
Una distribución es de cola pesada cuando para cualquier t > 0 ,F t>0
Una distribución con función de supervivencia tiene cola larga cuandoGF=1−F
Las distribuciones de cola larga son pesadas. Además, debido a que aumenta, el límite de la relación ( 2 ) no puede exceder 1 . Si existe y es menor que 1 , entonces G está disminuyendo exponencialmente, y eso permitirá que la integral ( 1 ) converja.G (2) 1 1 G (1)
La única forma de exhibir una distribución de cola pesada que no sea de cola larga, entonces, es modificar una distribución de cola larga para que continúe retenida mientras se viola ( 2 ) . Es fácil arruinar un límite: cámbielo en infinitos lugares que divergen hasta el infinito. Sin embargo, eso tomará algo de tiempo con F , que debe seguir aumentando y con retraso. Una forma es introducir algunos saltos hacia arriba en F , lo que hará que G salte hacia abajo, disminuyendo la relación G F ( x + 1 ) / G F ( x )(1) (2) F F G GF(x+1)/GF(x) . Con este fin, definamos una transformación que convierta F en otra función de distribución válida mientras crea un salto repentino en el valor u , digamos un salto a medio camino de F ( u ) a 1 :Tu F u F(u) 1
Esto altera ninguna propiedad básica de : T U [ F ] es todavía una función de distribución.F Tu[F]
El efecto sobre es hacer caer por un factor de 1 / 2 en u . Por lo tanto, dado que G no disminuye, entonces siempre que u - 1 ≤ x < u ,GF 1/2 u G u−1≤x<u
Si elegimos una secuencia creciente y divergente de , i = 1 , 2 , ... , y aplicamos cada T u i en sucesión, determina una secuencia de distribuciones F i con F 0 = F yui i=1,2,… Tui Fi F0=F
para . Después del i ésimo paso, F i ( x ) , F i + 1 ( x ) , ... todos permanecen iguales para x < u i . En consecuencia, la secuencia de F i ( x ) es una secuencia de funciones de distribución puntiaguda, acotada, no decreciente, lo que implica su límitei≥1 ith Fi(x),Fi+1(x),… x<ui Fi(x)
Es una función de distribución. Por construcción, no se cola larga debido a que hay infinitamente muchos puntos en los que su índice de supervivencia se reduce a 1 / 2 o por debajo, mostrando que no puede tener 1 como un limite.GF∞(x+1)/GF∞(x)) 1/2 1
Este gráfico muestra una función de supervivencia que ha sido cortado hacia abajo de esta manera en los puntos u 1 ≈ 12,9 , u 2 ≈ 40,5 , u 3 ≈ 101.6 , ... . Tenga en cuenta el eje vertical logarítmico.G(x)=x−1/5 u1≈12.9,u2≈40.5,u3≈101.6,….
La esperanza es poder elegir para que F ∞ siga siendo de cola pesada. Sabemos, porque F es de cola gruesa, que hay números 0 = u 0 < u 1 < u 2 < ⋯ < u n ⋯ para los cuales(ui) F∞ F 0=u0<u1<u2<⋯<un⋯
por cada . La razón para el 2 i - 1 a la derecha es que las probabilidades asignadas por F a valores hasta u i se han reducido sucesivamente a la mitad i - 1 veces. Ese procedimiento, cuando d F ( x ) se reemplaza por d F j ( x ) para cualquier j ≥ i , reducirá 2 i - 1 a 1 , pero no menos.i≥1 2i−1 F ui i−1 dF(x) dFj(x) j≥i 2i−1 1
Esta es una gráfica de para las densidades f correspondientes a la función de supervivencia anterior y su versión "reducida". Las áreas bajo esta curva contribuyen a la expectativa. El área de 1 a u 1 es 1 ; el área de u 1 a u 2 es 2 , que cuando se corta (a la porción azul inferior) se convierte en un área de 1 ; el área de u 2 a u 3 es 4 , que cuando se corta se convierte en un área de 1xf(x) f 1 u1 1 u1 u2 2 1 u2 u3 4 1 , y así. Por lo tanto, el área debajo de cada "escalón" sucesivo a la derecha es .1
Elija una secuencia de este tipo para definir F ∞ . Podemos verificar que sigue siendo de cola pesada seleccionando t = 1 / n para algún número entero n y aplicando la construcción:(ui) F∞ t=1/n n
If you would like a continuous, symmetric, zero-mean, unit-variance example, begin with a finite-variance long-tailed distribution.F(x)=1−x−p (for x>0 ) will do, provided p>1 ; so would a Student t distribution for any degrees of freedom exceeding 2 . The moments of F∞ cannot exceed those of F , whence it too has finite variance. "Mollify" it via convolution with a nice smooth distribution, such as a Gaussian: this will make it continuous but will not destroy its heavy tail (obviously) nor the absence of a long tail (not quite as obvious, but it becomes obvious if you change the Gaussian to, say, a Beta distribution whose support is compact).
Symmetrize the result--which I will still callF∞ --by defining
for allx∈R . Its variance will remain finite, so it can be standardized to the desired distribution.
fuente