¿Qué significa la afirmación de que la curtosis de una distribución normal es 3. ¿Significa que en la línea horizontal, el valor de 3 corresponde a la probabilidad máxima, es decir, 3 es el modo del sistema?
Cuando miro una curva normal, parece que el pico ocurre en el centro, también conocido como 0. Entonces, ¿por qué la curtosis no es 0 y en su lugar 3?
normal-distribution
moments
kurtosis
Víctor
fuente
fuente
Respuestas:
La curtosis ciertamente no es el lugar donde está el pico. Como dices, eso ya se llama modo.
La curtosis es el cuarto momento estandarizado: si , es una versión estandarizada de la variable que estamos viendo, entonces la curtosis poblacional es la cuarta potencia promedio de esa variable estandarizada; E(Z4). La curtosis de la muestra está correspondientemente relacionada con la cuarta potencia media de un conjunto estandarizado de valores de muestra (en algunos casos se escala por un factor que va a 1 en muestras grandes).Z= X- μσ mi( Z4 4)
Como observa, este cuarto momento estandarizado es 3 en el caso de una variable aleatoria normal. Como Alecos señala en los comentarios, algunas personas definen curtosis como ; eso a veces se llama exceso de curtosis (también es el cuarto acumulativo). Al ver la palabra 'curtosis' debe tener en cuenta esta posibilidad de que diferentes personas usen la misma palabra para referirse a dos cantidades diferentes (pero estrechamente relacionadas).mi( Z4 4)−3
La curtosis generalmente se describe como pico * (por ejemplo, cuán curvadamente curva es el pico, que presumiblemente fue la intención de elegir la palabra "curtosis") o de cola pesada (a menudo lo que la gente está interesada en usarlo para medir), pero en De hecho, el cuarto momento estandarizado habitual no mide ninguna de esas cosas.
De hecho, el primer volumen de Kendall y Stuart da contraejemplos que muestran que una curtosis más alta no está necesariamente asociada con un pico más alto (en una variable estandarizada) o colas más gruesas (de manera bastante similar que el tercer momento no mide lo que muchas personas creo que sí).
Sin embargo, en muchas situaciones hay cierta tendencia a asociarse con ambos, ya que a menudo se observa un mayor pico y una gran cola cuando la curtosis es mayor; simplemente debemos tener cuidado al pensar que es necesariamente el caso.
La curtosis y la asimetría están fuertemente relacionadas (la curtosis debe ser al menos 1 más que el cuadrado de la asimetría; la interpretación de la curtosis es algo más fácil cuando la distribución es casi simétrica.
Darlington (1970) y Moors (1986) mostraron que la medida del cuarto momento de la curtosis es, en efecto, la variabilidad sobre "los hombros" - , y Balanda y MacGillivray (1988) sugieren pensar en términos vagos relacionados con ese sentido ( y considere otras formas de medirlo). Si la distribución está muy concentrada alrededor de μ ± σ , entonces la curtosis es (necesariamente) pequeña, mientras que si la distribución se extiende lejos de μ ± σ (lo que tenderá a apilarla simultáneamente en el centro y mover la probabilidad hacia las colas en para alejarlo de los hombros), la curtosis del cuarto momento será grande.μ±σ μ±σ μ±σ
De Carlo (1997) es un punto de partida razonable (después de recursos más básicos como Wikipedia) para leer sobre curtosis.
Editar: veo algunas preguntas ocasionales sobre si un pico máximo (valores cercanos a 0) puede afectar la curtosis en absoluto. La respuesta es sí, definitivamente puede. Que este sea el caso es una consecuencia de ser el cuarto momento de una variable estandarizada: para aumentar el cuarto momento de una variable estandarizada, debe aumentar mientras mantiene constante E ( Z 2 ) . Esto significa que el movimiento de probabilidad más adentro de la cola debe ir acompañado de algo más adentro (adentro ( - 1 , 1 )E(Z4) E(Z2) (−1,1) ); y viceversa: si pones más peso en el centro mientras mantienes la varianza en 1, también pones algo en la cola.
[NB como se discutió en los comentarios, esto es incorrecto como una declaración general; aquí se requiere una declaración algo diferente.]
Este efecto de la variación que se mantiene constante está directamente relacionado con la discusión de la curtosis como "variación sobre los hombros" en los documentos de Darlington y Moors. Ese resultado no es una noción manual, sino una simple equivalencia matemática: no se puede sostener que es de otra manera sin tergiversar la curtosis.
[Mi inclusión de Kendall y Stuart en las referencias se debe a que su discusión sobre la curtosis también es relevante en este punto.]
Entonces, ¿qué podemos decir? La curtosis a menudo se asocia con un pico más alto y con una cola más pesada, sin tener que ocurrir tampoco marchitarse. Ciertamente es más fácil levantar la curtosis jugando con la cola (ya que es posible alejarse más de 1 sd) y luego ajustando el centro para mantener constante la varianza, pero eso no significa que el pico no tenga impacto; seguramente lo hace, y uno puede manipular la curtosis enfocándose en ella. La curtosis se asocia en gran medida pero no solo con el peso de la cola; nuevamente, observe la variación sobre el resultado de los hombros; en todo caso, eso es lo que está mirando la curtosis, en un sentido matemático inevitable.
Referencias
Balanda, KP y MacGillivray, HL (1988),
"Kurtosis: una revisión crítica".
Estadístico estadounidense 42 , 111-119.
Darlington, Richard B. (1970),
"¿Es la curtosis realmente un" pico "?"
Estadístico estadounidense 24 , 19-22.
Moors, JJA (1986),
"El significado de la curtosis: Darlington reexaminado".
Estadístico estadounidense 40 , 283-284.
DeCarlo, LT (1997),
"Sobre el significado y el uso de la curtosis".
Psychol Métodos, 2 , 292-307.
Kendall, MG y A. Stuart,
The Advanced Theory of Statistics ,
vol. 1, 3ª ed.
(Ediciones más recientes tienen Stuart y Ord)
fuente
Aquí hay una visualización directa para entender a qué se refiere el número "3" con respecto a la curtosis de la distribución normal.
DejarX estar normalmente distribuido y dejar Z= ( X- μ ) / σ . DejarV= Z4 4 . Considere la gráfica del pdf deV , pagV( v ) . Esta curva está a la derecha de cero, y se extiende hasta el infinito, con 0.999 cuantil 117.2, pero gran parte de la masa está cerca de cero; por ejemplo, 68% menos que 1.0.
La media de esta distribución es la curtosis. Una forma común de entender la media es como el "punto de equilibrio" del gráfico pdf. SiX es normal, esta curva pagV( v ) saldos a 3.0.
Esta representación también explica por qué la curtosis mide el peso de las colas de una distribución. SiX no es normal, la curva pagV( v ) "cae a la derecha" cuando la curtosis es mayor que 3.0, y en este caso la densidad de X se puede decir que tiene "cola más gruesa que la distribución normal". Del mismo modo, la curvapagV( v ) "cae a la izquierda" cuando la curtosis es menor que 3.0, y en este caso la densidad de X se puede decir que tiene "cola más ligera que la distribución normal".
Se cree comúnmente que una curtosis más alta se refiere a más masa cerca del centro (es decir, más masa cerca de 0 en el pdfpagV( v ) ) Si bien en muchos casos esto es cierto, obviamente no es la masa (posiblemente aumentada) cerca de cero lo que hace que el gráfico "caiga hacia la derecha" en el caso de curtosis alta. Es en cambio el apalancamiento de la cola.
Desde este punto de vista, la interpretación esencialmente correcta del "peso de la cola" de la curtosis podría caracterizarse más específicamente como "apalancamiento de la cola" para evitar confundir "mayor peso de la cola" con "mayor masa en la cola". Después de todo, es posible que una curtosis más alta corresponda a menos masa en la cola, pero donde esta masa disminuida ocupa una posición más distante.
"Dame el lugar donde pararme, y moveré la tierra". -Arquímedes
fuente