¿Cómo se relaciona la curtosis de una distribución con la geometría de la función de densidad?

12

La curtosis es medir el pico y la planeidad de una distribución. La función de densidad de la distribución, si existe, se puede ver como una curva y tiene características geométricas (como curvatura, convexidad, ...) relacionadas con su forma.

Entonces, me pregunto si la curtosis de una distribución está relacionada con algunas características geométricas de la función de densidad, lo que puede explicar el significado geométrico de la curtosis.

kurtosis geometry Tim
fuente

Estoy pidiendo alguna relación en la fórmula con alguna cantidad geométrica de la curva de densidad, no solo el significado vago que señalé en mi publicación. O está bien tener una explicación de por qué la curtosis tiene el significado geométrico

Tim

@Peter Eso está lejos de la verdad. Se puede modificar la geometría del gráfico del PDF casi arbitrariamente sin cambiar ningún momento específico (número finito de sus).

whuber

La pregunta estrechamente relacionada en stats.stackexchange.com/questions/25010/… sugiere cuál debería ser la respuesta correcta a esta pregunta.

whuber

@whuber, aunque estoy de acuerdo y gracias por ese ejemplo, también me pregunto si no dice más sobre la notable propiedad de esa familia particular de pdf que sobre la curtosis en general.

user603

@ user603 Eso es bueno preguntarse. Sin embargo, la declaración no se trata de esta familia en particular: simplemente sucede que para la distribución lognormal se puede producir una representación explícita de una clase de archivos PDF alternativos con los mismos momentos. Que es especial que todos los momentos son los mismos, pero alterando la mayoría de las distribuciones de una manera que corrige un número finito de sus momentos, no es difícil. (Es difícil para ciertas distribuciones discretas, como el Bernoulli, pero no tienen archivos PDF.)

whuber

17

Los momentos de una distribución continua, y funciones de ellos como la curtosis, le dicen muy poco sobre el gráfico de su función de densidad.

Considere, por ejemplo, los siguientes gráficos.

ingrese la descripción de la imagen aquí

Cada uno de estos es el gráfico de una función no negativa que se integra a : todos son archivos PDF. Además, todos tienen exactamente los mismos momentos, hasta el último número infinito de ellos. Por lo tanto comparten una kurtosis común (que pasa a ser igual a ). $1$ $-3+3 e^2+2 e^3+e^4$

Las fórmulas para estas funciones son

f_{k, s} (x) = \frac{1}{\sqrt{2 π} x} \exp (- \frac{1}{2} (\log (x))^{2}) (1 + s \sin (2 k π \log (x))

$f_{k,s}(x) = \frac{1}{\sqrt{2\pi}x} \exp\left(-\frac{1}{2}(\log(x))^2\right)\left(1 + s\sin(2 k \pi \log(x)\right)$

para y $x \gt 0,$ $-1\le s\le 1,$ $k\in\mathbb{Z}.$

La figura muestra valores de a la izquierda y valores de en la parte superior. La columna de la izquierda muestra el PDF para la distribución lognormal estándar. $s$ $k$

El ejercicio 6.21 de la Teoría avanzada de estadística de Kendall (Stuart y Ord, quinta edición) le pide al lector que demuestre que todos tienen los mismos momentos.

Uno puede modificar de manera similar cualquier pdf para crear otro pdf de forma radicalmente diferente pero con los mismos momentos centrales segundo y cuarto (digamos), que por lo tanto tendrían la misma curtosis. Solo a partir de este ejemplo, debería quedar muy claro que la curtosis no es una medida de simetría, unimodalidad, bimodalidad, convexidad o cualquier otra caracterización geométrica familiar de una curva fácilmente interpretable o intuitiva.

Por lo tanto, las funciones de los momentos (y la curtosis como un caso especial) no describen las propiedades geométricas de la gráfica del pdf. Esto tiene sentido intuitivamente: debido a que un pdf representa la probabilidad por medio del área, podemos cambiar casi libremente la densidad de probabilidad de una ubicación a otra, cambiando radicalmente la apariencia del pdf, al mismo tiempo que arreglamos cualquier número finito de momentos especificados previamente.

whuber
fuente

1

"Solo con este ejemplo, debería quedar muy claro ... cualquier otra caracterización geométrica familiar de una curva". Entiendo lo que quiere decir, pero hay motivos para una divergencia razonable en la interpretación aquí. Otra interpretación es la de Darlington, que muestra cómo a partir de una distribución simétrica, mover algo de masa en puntos específicos aumenta / disminuye la curtosis (nuevamente, no es una contradicción de su ejemplo, solo una comprensión más 'positiva').

usuario603

1

@ user603 No estoy en desacuerdo, pero creo que el enfoque "positivo" pasa por alto los supuestos muy especiales que se hacen implícitamente para que funcione. También se podría comenzar con el gráfico de un PDF extremadamente asimétrico cuya asimetría es cero (no son difíciles de construir). Por lo tanto, ese enfoque positivo simplemente describe lo que sucede con ciertos archivos PDF muy especiales cuando se mueve la masa. Aunque eso puede ser bastante útil para la intuición, parece no tener una relación lógica con la presente pregunta.

whuber

1

Estoy de acuerdo con la asimetría (y su respuesta en general). Pero la curtosis, como función, tiene un mínimo. Eso hace las cosas un poco más interesantes.

usuario603

1

@ usuario603 Gracias; Esa es una distinción perspicaz. No creo que cambie ninguna de las conclusiones actuales de manera importante, pero ciertamente ayuda a la intuición y señala una diferencia importante entre momentos pares e impares.

whuber

6

Para distribuciones simétricas (es decir, aquellas para las cuales los momentos centrados pares son significativos) la curtosis mide una característica geométrica del pdf subyacente. No es cierto que la curtosis mida (o esté relacionada en general) con el pico de una distribución. Más bien, la curtosis mide cuán lejos está la distribución subyacente de ser simétrica y bimodal (algebraicamente, una distribución perfectamente simétrica y bimodal tendrá una curtosis de 1, que es el valor más pequeño posible que puede tener la curtosis) [0].

En pocas palabras [1], si define:

k = E (x - μ)^{4} / σ^{4}

$k=E(x-\mu)^4/\sigma^4$

$E(X)=\mu,V(X)=\sigma^2$

k = V (Z^{2}) + 1 \geq 1

$k=V(Z^2)+1\ge1$

$Z=(X-\mu)/\sigma$

$k$ $Z^2$

[0] RB Darlington (1970). ¿Es la curtosis realmente un "pico"? El estadístico estadounidense, vol. 24, N ° 2.

[1] JJA Moors (1986). El significado de la curtosis: Darlington reexaminado. The American Statistician, Volumen 40, Número 4.

usuario603
fuente

1

Donde quiera que escribes "bimodal", ¿quieres decir "unimodal"?

whuber

1

f

$f$

μ

$\mu$

g (x) = (f (x) + f (2 μ - x)) / 2.

$g(x) = (f(x)+f(2\mu-x))/2.$

g

$g$

1

$1$ . Así, al menos, la curtosis no dice nada acerca de la bimodalidad. Como no es así, ¿qué propiedad geométrica del pdf está describiendo exactamente?

whuber

1

vamos a continuar esta discusión en el chat

whuber

1

La curtosis no indica bimodalidad, excepto en el caso extremo donde está cerca de su mínimo, donde indica algo similar a la distribución equiprobable de dos puntos. Puede tener distribuciones bimodales con todos los valores posibles de curtosis. Consulte ncbi.nlm.nih.gov/pmc/articles/PMC4321753 para ver ejemplos.

Peter Westfall

1

p

$p$

p

$p$

v \to 0

$v \rightarrow 0$

5

[Nota: esto fue escrito en respuesta a otra pregunta en el sitio; Las respuestas se fusionaron con la presente pregunta. Es por eso que esta respuesta parece responder a una pregunta redactada de manera diferente. Sin embargo, gran parte de la publicación debería ser relevante aquí.]

La curtosis realmente no mide la forma de las distribuciones. Tal vez dentro de algunas familias de distribución, se puede decir que describe la forma, pero en general la curtosis no le dice mucho acerca de la forma real. La forma se ve afectada por muchas cosas, incluidas las que no están relacionadas con la curtosis.

Si se realizan búsquedas de imágenes para la curtosis, se muestran bastantes imágenes como esta:

pag

que en cambio parecen estar cambiando la varianza, en lugar de aumentar la curtosis. A modo de comparación, aquí hay tres densidades normales que acabo de dibujar (usando R) con diferentes desviaciones estándar:

ingrese la descripción de la imagen aquí

Como puede ver, se ve casi idéntico a la imagen anterior. Todos estos tienen exactamente la misma curtosis. Por el contrario, aquí hay un ejemplo que probablemente esté más cerca del objetivo del diagrama

ingrese la descripción de la imagen aquí

$\sqrt{6}$

Esto suele ser lo que las personas quieren decir cuando hablan de curtosis que indica la forma de la densidad. Sin embargo, la curtosis puede ser sutil, no tiene que funcionar así.

Por ejemplo, en una variación dada, una curtosis más alta puede ocurrir con un pico más bajo.

También hay que tener cuidado con la tentación (y en muchos libros se dice abiertamente) que el exceso de curtosis cero implica normalidad. Hay distribuciones con exceso de curtosis 0 que no son nada normales. Aquí hay un ejemplo:

dgam 2.3

De hecho, eso también ilustra el punto anterior. Podría construir fácilmente una distribución de aspecto similar con curtosis más alta que la normal pero que todavía es cero en el centro, una ausencia total de pico.

Hay una serie de publicaciones en el sitio que describen aún más la curtosis. Un ejemplo está aquí .

Glen_b -Reinstate a Monica
fuente

¿Pero no lo dije? El libro lo dice?

Stat Tistician

Yo sé eso. Nunca dije que lo dijeras. ¿Cómo sugeriría que responda a declaraciones descaradamente incorrectas sobre las que me pregunta? ¿Solo finge que no están equivocados?

Glen_b -Reinstate Monica

1

@Glen_b Las imágenes no son del libro. El libro no da ilustraciones. Utilicé la búsqueda de imágenes goolge para estas ilustraciones.

Stat Tistician

2

Algunos autores escriben sobre la curtosis como pico y otros lo escriben como peso de la cola, pero la interpretación escéptica de que la curtosis es lo que mida la curtosis es la única historia totalmente segura. Los ejemplos numéricos dados por Irving Kaplansky (1945) solo son suficientes para mostrar que la curtosis no tiene ninguna interpretación inequívoca. (El artículo de Kaplansky es uno de los pocos que escribió a mediados de la década de 1940 sobre probabilidad y estadísticas. Es mucho mejor conocido como un algebraista distinguido). Referencia completa y más en stata-journal.com/sjpdf.html?articlenum=st0204

Nick Cox

1

Hay libros y documentos que afirman que la curtosis es el pico, por lo que mi primera cláusula sigue siendo correcta y compatible como una declaración sobre lo que está en la literatura. Lo que es más crucial es cómo se consideran los ejemplos y argumentos de Kaplansky.

Nick Cox

3

$\mu \pm \sigma$

Editar 23/11/2018: desde que escribí esta publicación, he desarrollado algunas perspectivas geométricas sobre la curtosis. Una es que el exceso de curtosis se puede visualizar geométricamente en términos de desviaciones de la línea esperada de 45 grados en las colas de la gráfica normal cuantil-cuantil; ver ¿Este gráfico QQ indica distribución leptokurtic o platykurtic?

$p_V(v)$ $V = \{(X - \mu)/\sigma \}^4$ $X$ $E(V)$ $V$ $X$

$\mu \pm \sigma$ $X$ $\mu \pm \sigma$ $\mu$ $\sigma$ $X$ $\le 0.25$ $\mu \pm \sigma$ $\mu$ $\sigma$

Peter Westfall
fuente

3

En lugar de seguir remitiendo a las personas a un artículo en la mayoría de sus publicaciones, ¿le importaría resumir los argumentos aquí? Vea la ayuda aquí en "siempre proporcione contexto para los enlaces", en particular donde dice "siempre cite la parte importante". No es necesariamente citarlo literalmente donde el argumento es extenso, pero al menos se necesita un resumen del argumento. Simplemente hace un par de declaraciones y luego enlaza a un documento. La declaración de que la curtosis mide el comportamiento de la cola es (contexto ausente) engañosa (demostrablemente)

Glen_b -Reinstate Monica el

2

... pero es imposible estar en desacuerdo con los argumentos que no presenta aquí, y tal vez llegar a una conclusión más matizada.

Glen_b -Reinstate Monica el

Mis argumentos están claramente expuestos aquí: en.wikipedia.org/wiki/… ¡ Comentarios bienvenidos! Por cierto, la curtosis ES una medida del peso de la cola, simplemente no es lo mismo que otros que se han considerado. Mide el peso de la cola a través de E (Z ^ 4), que es una medida del peso de la cola ya que los valores | Z | <1 le contribuyen muy poco. Según la misma lógica, E (Z ^ n), para potencias pares más altas n, también son medidas de peso de cola.

Peter Westfall

Hola Peter, visita stats.stackexchange.com/help/merging-accounts para combinar tus cuentas y poder modificar tus publicaciones anteriores.

whuber

3

Un tipo diferente de respuesta: podemos ilustrar la curtosis geométricamente, usando ideas de http://www.quantdec.com/envstats/notes/class_06/properties.htm : momentos gráficos.

k = E {(\frac{X - μ}{σ})}^{4} = \int (\frac{x - μ}{σ})^{4} f (x) d x

$\DeclareMathOperator{\E}{\mathbb{E}} k = \E \left( \frac{X-\mu}{\sigma} \right)^4 =\int (\frac{x-\mu}{\sigma})^4 f(x) \; dx$

f

$f$

X

$X$

μ, σ^{2}

$\mu, \sigma^2$

x

$x$

k_{e} = k - 3

$k_e=k-3$

A continuación, mostraré una gráfica de curtosis gráfica para algunas distribuciones simétricas, todas centradas en cero y escaladas para tener una varianza 1.

Tenga en cuenta la virtual ausencia de contribución a la curtosis desde el centro, lo que demuestra que la curtosis no tiene mucho que ver con el "pico".

kjetil b halvorsen
fuente

1

Z^{2}

$Z^2$

- b

$-b$

+ b

$+b$

b

$b$

¿Cómo se relaciona la curtosis de una distribución con la geometría de la función de densidad?

Respuestas: