¿Puede alguien proporcionar una intuición sobre por qué los momentos más altos de una distribución de probabilidad , como el tercer y cuarto momento, corresponden a asimetría y curtosis respectivamente? Específicamente, ¿por qué la desviación sobre la media elevada a la tercera o cuarta potencia termina traduciéndose en una medida de asimetría y curtosis? ¿Hay alguna manera de relacionar esto con la tercera o cuarta derivada de la función?
Considere esta definición de asimetría y curtosis:
En estas ecuaciones elevamos el valor normalizado a una potencia y tomamos su valor esperado. No me queda claro por qué elevar la variable aleatoria normalizada a la potencia de cuatro da "pico" o por qué elevar la variable aleatoria normalizada a la potencia de tres debería dar "sesgo". ¡Esto parece mágico y misterioso!
Respuestas:
Hay una buena razón para estas definiciones, que se vuelve más clara cuando observa la forma general de los momentos de variables aleatorias estandarizadas. Para responder a esta pregunta, primero considerar la forma general de la º estandarizada momento central :n ††
Los primeros dos momentos centrales estandarizados son los valores y , que se mantienen para todas las distribuciones para las cuales la cantidad anterior está bien definida. Por lo tanto, podemos considerar los momentos centrales estandarizados no triviales que ocurren para los valores . Para facilitar nuestro análisis definimos:ϕ1=0 ϕ2=1 n⩾3
Estas son cantidades no negativos que dan la º absoluta de potencia de la condicional variable aleatoria estandarizada con que sea por encima o por debajo de su valor esperado. Ahora descompondremos el momento central estandarizado en estas partes.n
Los valores impares de miden el sesgo en las colas:n para cualquier valor impar de tenemos una potencia impar en la ecuación de momento y así podemos escribir el momento central estandarizado como . De esta forma vemos que el momento central estandarizada nos da la diferencia entre el º poder absoluto de la variable aleatoria estandarizada, sujeto a que quede por encima o por debajo de su media, respectivamente.n⩾3 ϕn=ϕ+n−ϕ−n n
Por lo tanto, para cualquier potencia impar obtendremos una medida que proporcione valores positivos si la potencia absoluta esperada de la variable aleatoria estandarizada es mayor para valores superiores a la media que para valores inferiores a la media, y da valores negativos si se espera la potencia absoluta es menor para valores superiores a la media que para valores inferiores a la media. Cualquiera de estas cantidades podría considerarse razonablemente como una medida de un tipo de "asimetría", con potencias más altas que otorgan mayor peso relativo a valores que están lejos de la media.n⩾3
Dado que este fenómeno ocurre para cada poder impar , la elección natural para una medida arquetípica de "asimetría" es definir como asimetría. Este es un momento central estandarizado más bajo que los poderes impares más altos, y es natural explorar los momentos de orden inferior antes de considerar los momentos de orden superior. En estadística hemos adoptado la convención de referirnos a este momento central estandarizado como la asimetría , ya que es el momento central estandarizado más bajo que mide este aspecto de la distribución. (Los poderes impares más altos también miden los tipos de asimetría, pero con un énfasis cada vez mayor en valores lejos de la media).n⩾3 ϕ3
Los valores pares de miden la gordura de las colas:n para cualquier valor par de tenemos una potencia par en la ecuación de momento y así podemos escribir el momento central estandarizado como . De esta forma vemos que el momento central estandarizada nos da la suma de los º poder absoluto de la variable aleatoria estandarizada, sujeto a que quede por encima o por debajo de su media, respectivamente.n⩾3 ϕn=ϕ+n+ϕ−n n
Por lo tanto, para cualquier potencia uniforme obtendremos una medida que proporcione valores no negativos, con valores más altos si las colas de la distribución de la variable aleatoria estandarizada son más gordas. Tenga en cuenta que este es un resultado con respecto a la variable aleatoria estandarizada , por lo que un cambio de escala (cambio de la varianza) no tiene efecto en esta medida. Más bien, es efectivamente una medida de la gordura de las colas, después de estandarizar la variación de la distribución. Cualquiera de estas cantidades podría considerarse razonablemente como una medida de un tipo de "curtosis", con potencias más altas que otorgan mayor peso relativo a valores que están lejos de la media.n⩾3
Dado que este fenómeno ocurre para cada potencia par , la elección natural para una medida arquetípica de curtosis es definir como la curtosis. Este es un momento central estandarizado más bajo que los poderes pares más altos, y es natural explorar los momentos de orden inferior antes de considerar los momentos de orden superior. En estadística hemos adoptado la convención de referirnos a este momento central estandarizado como la "curtosis", ya que es el momento central estandarizado más bajo que mide este aspecto de la distribución. (Los poderes pares más altos también miden los tipos de curtosis, pero con un énfasis cada vez mayor en valores lejos de la media).n⩾3 ϕ4
fuente
Pregunta similar ¿ Qué es tan 'momento' sobre 'momentos' de una distribución de probabilidad? Di una respuesta física a lo que abordaba los momentos.
"La aceleración angular es la derivada de la velocidad angular, que es la derivada del ángulo con respecto al tiempo, es decir, . Considere que el segundo momento es análogo al torque aplicado a un movimiento circular, o si va a realizar una aceleración / desaceleración (también segunda derivada) de ese movimiento circular (es decir, angular, ). Del mismo modo, el tercer momento ser una tasa de cambio de torque, y así sucesivamente por momentos aún más altos para hacer tasas de cambio de tasas de cambio de tasas de cambio, es decir, derivadas secuenciales de movimiento circular ... "dωdt=α,dθdt=ω θ
Vea el enlace ya que esto es quizás más fácil de visualizar con ejemplos físicos.
La asimetría es más fácil de entender que la curtosis. Una asimetría negativa es una cola izquierda más pesada (o una dirección negativa más atípica) que a la derecha y una asimetría positiva lo contrario.
Wikipedia cita a Westfall (2014) e implica que la curtosis alta surge ya sea para variables aleatorias que tienen valores atípicos o para funciones de densidad con una o dos colas pesadas, al tiempo que afirma que cualquier tendencia central de datos o densidad tiene un efecto relativamente pequeño sobre el valor de la curtosis. Los valores bajos de curtosis implicarían lo contrario, es decir, la falta de valores atípicos del eje la relativa ligereza de ambas colas.x
fuente