Lo primero que debe hacer es formalizar lo que queremos decir con "cola más pesada". Se podría observar qué tan alta es la densidad en la cola extrema después de estandarizar ambas distribuciones para tener la misma ubicación y escala (por ejemplo, desviación estándar):
(de esta respuesta, que también es algo relevante para su pregunta )
[Para este caso, la escala realmente no importa al final; la t seguirá siendo "más pesada" de lo normal incluso si usa escalas muy diferentes; lo normal siempre baja más eventualmente]
Sin embargo, esa definición, aunque funciona bien para esta comparación en particular, no se generaliza muy bien.
En términos más generales, una definición mucho mejor está en la respuesta de Whuber aquí . Entonces, si tiene una cola más pesada que , a medida que vuelve suficientemente grande (para todo algo de ), entonces , donde , donde es el cdf (para más pesado) -tailed a la derecha; hay una definición similar y obvia en el otro lado).YXtt>t0SY(t)>SX(t)S=1−FF
Aquí está en la escala logarítmica y en la escala cuantil de lo normal, lo que nos permite ver más detalles:
Entonces, la "prueba" de una mayor cola implicaría comparar cdfs y mostrar que la cola superior del t-cdf eventualmente siempre se encuentra por encima de la normal y la cola inferior del t-cdf finalmente siempre se encuentra por debajo de la normal.
En este caso, lo más fácil es comparar las densidades y luego mostrar que la posición relativa correspondiente de los cdf (/ funciones de supervivencia) debe seguir a partir de eso.
Entonces, por ejemplo, si puede argumentar que (en algún dado )ν
x2−(ν+1)log(1+x2ν)>2⋅log(k)†
para la constante necesaria (una función de ), para todo algo , entonces sería posible establecer una cola más pesada para también en la definición en términos de más grande (o más grande en la cola izquierda)kνx>x0tν1−FF
† (esta forma se deduce de la diferencia del registro de las densidades, si eso mantiene la relación necesaria entre las densidades)
[En realidad, es posible mostrarlo para cualquier (no solo el particular que necesitamos proveniente de las constantes de normalización de densidad relevantes), por lo que el resultado debe mantenerse para el que necesitamos.]kk
Una forma de ver la diferencia es mediante el uso de los momentosE{xn}.
Las colas "más pesadas" significarán valores más altos para los momentos de potencia pares (potencia 4, 6, 8), cuando la varianza es la misma. En particular, el momento del cuarto orden (alrededor de cero) se llama curtosis y compara en cierto sentido exacto el peso de las colas.
Ver Wikipedia para más detalles ( https://en.wikipedia.org/wiki/Kurtosis )
fuente
Aquí hay una prueba formal basada en las funciones de supervivencia. Utilizo la siguiente definición de "cola más pesada" inspirada en wikipedia :
Una variable aleatoria con función de supervivencia tiene colas más pesadas que una variable aleatoria con función de supervivencia iffY Sy(t) X Sx(t)
Considere una variable aleatoria distribuida como t de Student con media cero, grados de libertad y parámetro de escala . Comparamos esto con la variable aleatoria . Para ambas variables, las funciones de supervivencia son diferenciables. Por lo tanto,Y ν a X∼N(0,σ2)
Es importante destacar que el resultado es válido para valores arbitrarios (finitos) de , y , por lo que puede tener situaciones en las que la distribución tiene una varianza menor que la normal, pero aún tiene colas más pesadas.a σ2 ν
fuente