Ejemplo de distribución de cola pesada que no es de cola larga

14

De las lecturas sobre distribuciones de cola larga y pesada, entendí que todas las distribuciones de cola larga son de cola pesada , pero no todas las distribuciones de cola larga son de cola larga .

¿Podría alguien proporcionar un ejemplo de:

  • una función continua, simétrica, de densidad media cero que es de cola larga
  • una función continua, simétrica, de densidad media cero que es de cola gruesa pero no de cola larga

para poder entender mejor el significado de sus definiciones?

Sería aún mejor si ambos pudieran tener una variación de unidad.

toliveira
fuente
2
¿Dónde encontraste esas definiciones? ¿Puedes darles aquí? ¡Pensé en estos como sinónimos!
kjetil b halvorsen
@kjetilbhalvorsen: Quizás aquí: en.wikipedia.org/wiki/…
Scortchi - Restablezca a Monica
@kjetilbhalvorsen SA: Ver, enlace E. LA: Estaba estudiando las definiciones de distribuciones "pesadas", "gordas" y "de cola larga", y encontré explicaciones útiles en: (A) [ stats.stackexchange.com/ preguntas / 10726 /… , (B) [ en.wikipedia.org/wiki/Heavy-tailed_distribution] , (C) [ users.cms.caltech.edu/~adamw/papers/… , (continuación)
toliveira
(continuación) (E) math.stackexchange.com/questions/685921/… Comprendí que (i) la distribución de cola pesada se define como en A, B, C, D, E, (ii) se define la distribución de cola larga como en B, C, E (iii) la definición de cola gorda es floja, como se explica en A.
toliveira

Respuestas:

16

Las dos definiciones son cercanas, pero no exactamente iguales. Una diferencia radica en la necesidad de que la tasa de supervivencia tenga un límite.

Para la mayor parte de esta respuesta, ignoraré los criterios para que la distribución sea continua, simétrica y de varianza finita, porque estos son fáciles de lograr una vez que hayamos encontrado cualquier distribución de cola pesada de varianza finita que no sea de cola larga.


Una distribución es de cola pesada cuando para cualquier t > 0 ,Ft>0

(1)RetxdF(x)=.

Una distribución con función de supervivencia tiene cola larga cuandoGF=1F

(2)limxGF(x+1)GF(x)=1.

Las distribuciones de cola larga son pesadas. Además, debido a que aumenta, el límite de la relación ( 2 ) no puede exceder 1 . Si existe y es menor que 1 , entonces G está disminuyendo exponencialmente, y eso permitirá que la integral ( 1 ) converja.G(2)11G(1)

La única forma de exhibir una distribución de cola pesada que no sea de cola larga, entonces, es modificar una distribución de cola larga para que continúe retenida mientras se viola ( 2 ) . Es fácil arruinar un límite: cámbielo en infinitos lugares que divergen hasta el infinito. Sin embargo, eso tomará algo de tiempo con F , que debe seguir aumentando y con retraso. Una forma es introducir algunos saltos hacia arriba en F , lo que hará que G salte hacia abajo, disminuyendo la relación G F ( x + 1 ) / G F ( x )(1)(2)FFGGF(x+1)/GF(x). Con este fin, definamos una transformación que convierta F en otra función de distribución válida mientras crea un salto repentino en el valor u , digamos un salto a medio camino de F ( u ) a 1 :TuFuF(u)1

Tu[F](x)={F(x)u<x12(1F(x))+F(x)ux

Esto altera ninguna propiedad básica de : T U [ F ] es todavía una función de distribución.FTu[F]

El efecto sobre es hacer caer por un factor de 1 / 2 en u . Por lo tanto, dado que G no disminuye, entonces siempre que u - 1 x < u ,GF1/2uGu1x<u

GTu[F](x+1)GTu[F](x)12.

Si elegimos una secuencia creciente y divergente de , i = 1 , 2 , ... , y aplicamos cada T u i en sucesión, determina una secuencia de distribuciones F i con F 0 = F yuii=1,2,TuiFiF0=F

Fi+1=Tui[Fi]

para . Después del i ésimo paso, F i ( x ) , F i + 1 ( x ) , ... todos permanecen iguales para x < u i . En consecuencia, la secuencia de F i ( x ) es una secuencia de funciones de distribución puntiaguda, acotada, no decreciente, lo que implica su límitei1ithFi(x),Fi+1(x),x<uiFi(x)

F=limiFi

Es una función de distribución. Por construcción, no se cola larga debido a que hay infinitamente muchos puntos en los que su índice de supervivencia se reduce a 1 / 2 o por debajo, mostrando que no puede tener 1 como un limite.GF(x+1)/GF(x))1/21

Figure 1: An altered survival function

Este gráfico muestra una función de supervivencia que ha sido cortado hacia abajo de esta manera en los puntos u 112,9 , u 240,5 , u 3101.6 , ... . Tenga en cuenta el eje vertical logarítmico.G(x)=x1/5u112.9,u240.5,u3101.6,.

La esperanza es poder elegir para que F siga siendo de cola pesada. Sabemos, porque F es de cola gruesa, que hay números 0 = u 0 < u 1 < u 2 < < u n para los cuales(ui)FF0=u0<u1<u2<<un

ui1uiex/idF(x)2i1

por cada . La razón para el 2 i - 1 a la derecha es que las probabilidades asignadas por F a valores hasta u i se han reducido sucesivamente a la mitad i - 1 veces. Ese procedimiento, cuando d F ( x ) se reemplaza por d F j ( x ) para cualquier j i , reducirá 2 i - 1 a 1 , pero no menos.i12i1Fuii1dF(x)dFj(x)ji2i11

Figure 2: A cut-down density function

Esta es una gráfica de para las densidades f correspondientes a la función de supervivencia anterior y su versión "reducida". Las áreas bajo esta curva contribuyen a la expectativa. El área de 1 a u 1 es 1 ; el área de u 1 a u 2 es 2 , que cuando se corta (a la porción azul inferior) se convierte en un área de 1 ; el área de u 2 a u 3 es 4 , que cuando se corta se convierte en un área de 1xf(x)f1u11u1u221u2u341, y así. Por lo tanto, el área debajo de cada "escalón" sucesivo a la derecha es .1

Elija una secuencia de este tipo para definir F . Podemos verificar que sigue siendo de cola pesada seleccionando t = 1 / n para algún número entero n y aplicando la construcción:(ui)Ft=1/nn

RetxdF(x)=Rex/ndF(x)=i=1ui1uiex/ndF(x)i=n+1ui1uiex/ndF(x)i=n+1ui1uiex/idF(x)=i=n+1ui1uiex/idFi(x)i=n+11,

tF

Figure 3: plot of G(1+x)/G(x)

G(x+1)/G(x) for the cut down distribution. Like the ratio of the original G, it tends toward an upper accumulation value of 1--but for unit-width intervals terminating at the ui, the ratio suddenly drops to only half of what it originally was. These drops, although becoming less and less frequent as x increases, occur infinitely often and therefore prevent the ratio from approaching 1 in the limit.


If you would like a continuous, symmetric, zero-mean, unit-variance example, begin with a finite-variance long-tailed distribution. F(x)=1xp (for x>0) will do, provided p>1; so would a Student t distribution for any degrees of freedom exceeding 2. The moments of F cannot exceed those of F, whence it too has finite variance. "Mollify" it via convolution with a nice smooth distribution, such as a Gaussian: this will make it continuous but will not destroy its heavy tail (obviously) nor the absence of a long tail (not quite as obvious, but it becomes obvious if you change the Gaussian to, say, a Beta distribution whose support is compact).

Symmetrize the result--which I will still call F--by defining

Fs(x)=12(1+sgn(x)F(|x|))

for all xR. Its variance will remain finite, so it can be standardized to the desired distribution.

whuber
fuente
2
Brilliantly explained. You offered not just an example but also the justification for it. The clarity of the explanation allowed me to understand (almost) the whole of it. I will practice it in some numerical examples.
toliveira