Ejemplo de distribución de cola pesada que no es de cola larga

Las dos definiciones son cercanas, pero no exactamente iguales. Una diferencia radica en la necesidad de que la tasa de supervivencia tenga un límite.

Para la mayor parte de esta respuesta, ignoraré los criterios para que la distribución sea continua, simétrica y de varianza finita, porque estos son fáciles de lograr una vez que hayamos encontrado cualquier distribución de cola pesada de varianza finita que no sea de cola larga.

Una distribución es de cola pesada cuando para cualquier , $F$ $t\gt 0$

\begin{matrix} (1) & \int_{R} e^{t x} d F (x) = \infty . \end{matrix}

$\int_\mathbb{R} e^{t x} dF(x) = \infty.\tag{1}$

Una distribución con función de supervivencia tiene cola larga cuando $G_F = 1-F$

\begin{matrix} (2) & lim_{x \to \infty} \frac{G_{F} (x + 1)}{G_{F} (x)} = 1. \end{matrix}

$\lim_{x\to \infty} \frac{G_F(x+1)}{G_F(x)} = 1.\tag{2}$

Las distribuciones de cola larga son pesadas. Además, debido a que aumenta, el límite de la relación no puede exceder . Si existe y es menor que , entonces está disminuyendo exponencialmente, y eso permitirá que la integral converja. $G$ $(2)$ $1$ $1$ $G$ $(1)$

La única forma de exhibir una distribución de cola pesada que no sea de cola larga, entonces, es modificar una distribución de cola larga para que continúe retenida mientras se viola . Es fácil arruinar un límite: cámbielo en infinitos lugares que divergen hasta el infinito. Sin embargo, eso tomará algo de tiempo con , que debe seguir aumentando y con retraso. Una forma es introducir algunos saltos hacia arriba en , lo que hará que salte hacia abajo, disminuyendo la relación $(1)$ $(2)$ $F$ $F$ $G$ $G_F(x+1)/G_F(x)$ . Con este fin, definamos una transformación que convierta en otra función de distribución válida mientras crea un salto repentino en el valor , digamos un salto a medio camino de a : $T_u$ $F$ $u$ $F(u)$ $1$

T_{u} [F] (x) = {\begin{cases} F (x) & u < x \\ \frac{1}{2} (1 - F (x)) + F (x) & u \geq x \end{cases}

$T_u[F](x) = \begin{cases} F(x) & u<x \\ \frac{1}{2} (1-F(x))+F(x) & u\geq x \end{cases}$

Esto altera ninguna propiedad básica de : es todavía una función de distribución. $F$ $T_u[F]$

El efecto sobre es hacer caer por un factor de en . Por lo tanto, dado que no disminuye, entonces siempre que , $G_F$ $1/2$ $u$ $G$ $u-1 \le x \lt u$

\frac{G_{T_{u} [F]} (x + 1)}{G_{T_{u} [F]} (x)} \leq \frac{1}{2} .

$\frac{G_{T_u[F]}(x + 1)}{G_{T_u[F]}(x )} \le \frac{1}{2}.$

Si elegimos una secuencia creciente y divergente de , , y aplicamos cada en sucesión, determina una secuencia de distribuciones con y $u_i$ $i=1, 2, \ldots$ $T_{u_i}$ $F_i$ $F_0=F$

F_{i + 1} = T_{u_{i}} [F_{i}]

$F_{i+1} = T_{u_i}[F_i]$

para . Después del paso, todos permanecen iguales para . En consecuencia, la secuencia de es una secuencia de funciones de distribución puntiaguda, acotada, no decreciente, lo que implica su límite $i \ge 1$ $i^\text{th}$ $F_i(x), F_{i+1}(x), \ldots$ $x\lt u_i$ $F_i(x)$

F_{\infty} = lim_{i \to \infty} F_{i}

$F_\infty = \lim_{i\to\infty} F_i$

Es una función de distribución. Por construcción, no se cola larga debido a que hay infinitamente muchos puntos en los que su índice de supervivencia se reduce a o por debajo, mostrando que no puede tener como un limite. $G_{F_\infty}(x+1)/G_{F_\infty}(x))$ $1/2$ $1$

Este gráfico muestra una función de supervivencia que ha sido cortado hacia abajo de esta manera en los puntos Tenga en cuenta el eje vertical logarítmico. $G(x) = x^{-1/5}$ $u_1 \approx 12.9, u_2 \approx 40.5, u_3 \approx 101.6, \ldots.$

La esperanza es poder elegir para que siga siendo de cola pesada. Sabemos, porque es de cola gruesa, que hay números para los cuales $(u_i)$ $F_\infty$ $F$ $0 = u_0 \lt u_1 \lt u_2 \lt \cdots \lt u_n \cdots$

\int_{u_{i - 1}}^{u_{i}} e^{x / i} d F (x) \geq 2^{i - 1}

$\int_{u_{i-1}}^{u_i} e^{x/i} dF(x) \ge 2^{i-1}$

por cada . La razón para el a la derecha es que las probabilidades asignadas por a valores hasta se han reducido sucesivamente a la mitad veces. Ese procedimiento, cuando se reemplaza por para cualquier , reducirá a , pero no menos. $i \ge 1$ $2^{i-1}$ $F$ $u_i$ $i-1$ $dF(x)$ $dF_{j}(x)$ $j\ge i$ $2^{i-1}$ $1$

Esta es una gráfica de para las densidades correspondientes a la función de supervivencia anterior y su versión "reducida". Las áreas bajo esta curva contribuyen a la expectativa. El área de a es ; el área de a es , que cuando se corta (a la porción azul inferior) se convierte en un área de ; el área de a es , que cuando se corta se convierte en un área de $x f(x)$ $f$ $1$ $u_1$ $1$ $u_1$ $u_2$ $2$ $1$ $u_2$ $u_3$ $4$ $1$ , y así. Por lo tanto, el área debajo de cada "escalón" sucesivo a la derecha es . $1$

Elija una secuencia de este tipo para definir . Podemos verificar que sigue siendo de cola pesada seleccionando para algún número entero y aplicando la construcción: $(u_i)$ $F_\infty$ $t=1/n$ $n$

\begin{aligned} \int_{R} e^{t x} d F_{\infty} (x) & = \int_{R} e^{x / n} d F_{\infty} (x) \\ = \sum_{i = 1}^{\infty} \int_{u_{i - 1}}^{u_{i}} e^{x / n} d F_{\infty} (x) \\ \geq \sum_{i = n + 1}^{\infty} \int_{u_{i - 1}}^{u_{i}} e^{x / n} d F_{\infty} (x) \\ \geq \sum_{i = n + 1}^{\infty} \int_{u_{i - 1}}^{u_{i}} e^{x / i} d F_{\infty} (x) \\ = \sum_{i = n + 1}^{\infty} \int_{u_{i - 1}}^{u_{i}} e^{x / i} d F_{i} (x) \\ \geq \sum_{i = n + 1}^{\infty} 1, \end{aligned}

$\eqalign{ \int_\mathbb{R} e^{t x} dF_\infty(x) &=\int_\mathbb{R} e^{x/n} dF_\infty(x) \\ &= \sum_{i=1}^\infty \int_{u_{i-1}}^{u_i} e^{x/n} dF_\infty(x) \\ &\ge \sum_{i=n+1}^\infty \int_{u_{i-1}}^{u_i} e^{x/n} dF_\infty(x) \\ &\ge \sum_{i=n+1}^\infty \int_{u_{i-1}}^{u_i} e^{x/i} dF_\infty(x) \\ &= \sum_{i=n+1}^\infty \int_{u_{i-1}}^{u_i} e^{x/i} dF_i(x) \\ &\ge \sum_{i=n+1}^\infty 1, }$

$t$ $F_\infty$

$G(x+1)/G(x)$ for the cut down distribution. Like the ratio of the original $G$ , it tends toward an upper accumulation value of $1$ --but for unit-width intervals terminating at the $u_i$ , the ratio suddenly drops to only half of what it originally was. These drops, although becoming less and less frequent as $x$ increases, occur infinitely often and therefore prevent the ratio from approaching $1$ in the limit.

If you would like a continuous, symmetric, zero-mean, unit-variance example, begin with a finite-variance long-tailed distribution. $F(x) = 1 - x^{-p}$ (for $x \gt 0$ ) will do, provided $p \gt 1$ ; so would a Student t distribution for any degrees of freedom exceeding $2$ . The moments of $F_\infty$ cannot exceed those of $F$ , whence it too has finite variance. "Mollify" it via convolution with a nice smooth distribution, such as a Gaussian: this will make it continuous but will not destroy its heavy tail (obviously) nor the absence of a long tail (not quite as obvious, but it becomes obvious if you change the Gaussian to, say, a Beta distribution whose support is compact).

Symmetrize the result--which I will still call $F_\infty$ --by defining

F_{s} (x) = \frac{1}{2} (1 + sgn (x) F_{\infty} (| x |))

$F_s(x) = \frac{1}{2}\left(1 + \text{sgn}(x) F_\infty(|x|)\right)$

for all $x\in\mathbb{R}$ . Its variance will remain finite, so it can be standardized to the desired distribution.

whuber
fuente

Brilliantly explained. You offered not just an example but also the justification for it. The clarity of the explanation allowed me to understand (almost) the whole of it. I will practice it in some numerical examples.

toliveira

Ejemplo de distribución de cola pesada que no es de cola larga

Respuestas: