Por lo general, se nos presenta el método de estimadores de momentos "equiparando los momentos de la población con su contraparte de muestra" hasta que hayamos estimado todos los parámetros de la población; de modo que, en el caso de una distribución normal, solo necesitaríamos el primer y segundo momento porque describen completamente esta distribución.
Y teóricamente podríamos calcular hasta momentos adicionales como:
¿Cómo puedo construir la intuición de los momentos que realmente son? Sé que existen como un concepto en física y en matemáticas, pero no encuentro ninguno directamente aplicable, especialmente porque no sé cómo hacer la abstracción del concepto de masa a un punto de datos. El término parece usarse de manera específica en estadística, que difiere del uso en otras disciplinas.
¿Qué característica de mis datos determina cuántos ( ) momentos hay en general?
Respuestas:
Ha pasado mucho tiempo desde que tomé una clase de física, así que avíseme si algo de esto es incorrecto.
Descripción general de momentos con análogos físicos.
Tome una variable aleatoria, . El n momento -ésimo de X alrededor de c es: m n ( c ) = E [ ( X - c ) n ] Esto corresponde exactamente a la sensación física de un momento. Imagine X como una colección de puntos a lo largo de la línea real con densidad dada por el pdf. Coloque un punto de apoyo debajo de esta línea en c y comience a calcular los momentos relativos a ese punto de apoyo, y los cálculos corresponderán exactamente a los momentos estadísticos.X norte X C
La mayor parte del tiempo, el momento -ésimo de X se refiere al momento alrededor de 0 (de momentos en los que se coloca el punto de apoyo en 0): m n = E [ X n ] El n -ésimo central de momento de X es: m n = m n ( m 1 ) = E [ ( X - m 1 ) n ]norte X
El -ésimo estandarizada momento de X es: ~ m n = m nnorte X
Nuevamente, esto escala los momentos por la extensión de la distribución, lo que permite una interpretación más fácil específicamente de la curtosis. El primer momento estandarizado siempre será cero, el segundo siempre será uno. Esto corresponde al momento del puntaje estándar (puntaje z) de una variable. No tengo un gran análogo físico para este concepto.
Momentos de uso común
Para cualquier distribución hay potencialmente un número infinito de momentos. Los momentos suficientes casi siempre caracterizarán y distribuirán completamente (derivar las condiciones necesarias para que esto sea seguro es parte del problema del momento ). Se habla comúnmente de cuatro momentos sobre las estadísticas:
Raramente hablamos de momentos más allá de la curtosis, precisamente porque hay muy poca intuición para ellos. Esto es similar a los físicos que se detienen después del segundo momento.
fuente
Este es un poco un hilo viejo, pero deseo corregir una declaración errónea en el comentario de Fg Nu, quien escribió "Los momentos están parametrizados por los números naturales y caracterizan completamente una distribución".
Los momentos NO caracterizan completamente una distribución. Específicamente, el conocimiento de un número infinito de momentos, incluso si existen, no determina necesariamente de manera única la distribución.
Según mi libro de probabilidades favorito, Feller "Introducción a la teoría de la probabilidad y sus aplicaciones Vol. II" (vea mi respuesta en Ejemplos de la vida real de distribuciones comunes ), ejemplo de la sección VII.3 en las páginas 227-228, lo Lognormal no está determinado por sus momentos, lo que significa que hay otras distribuciones que tienen un número infinito de momentos iguales al Lognormal, pero diferentes funciones de distribución. Como es ampliamente conocido, la función de generación de momentos no existe para el Lognormal, ni puede existir para estas otras distribuciones que poseen los mismos momentos.
diverge Tenga en cuenta que esto no es un if y solo if. Esta condición no se cumple para lo Lognormal, y de hecho no está determinada por sus momentos.
Por otro lado, las distribuciones (variables aleatorias) que comparten un número infinito de momentos, solo pueden diferir en gran medida, debido a las desigualdades que pueden derivarse de sus momentos.
fuente
Un corolario de las observaciones de Glen_b es que el primer momento, la media, corresponde al centro de gravedad de un objeto físico, y el segundo momento alrededor de la media, la varianza, corresponde a su momento de inercia. Después de eso, estás solo.
fuente
Un árbol binomial tiene dos ramas, cada una con una probabilidad de 0.5. En realidad, p = 0.5 y q = 1-0.5 = 0.5. Esto genera una distribución normal con una masa de probabilidad distribuida uniformemente.
En realidad, debemos suponer que cada nivel del árbol está completo. Cuando dividimos los datos en contenedores, obtenemos un número real de la división, pero lo redondeamos. Bueno, ese es un nivel que está incompleto, por lo que no terminamos con un histograma que se aproxime a lo normal.
Cambie las probabilidades de ramificación a p = 0.9999 yq = 0.0001 y eso nos da una normalidad sesgada. La masa de probabilidad cambió. Eso explica la asimetría.
Tener niveles incompletos o contenedores de menos de 2 ^ n genera árboles binomiales con áreas que no tienen masa de probabilidad. Esto nos da curtosis.
Respuesta al comentario:
Cuando hablaba de determinar el número de contenedores, redondee al siguiente número entero.
Las máquinas Quincunx lanzan bolas que finalmente se aproximan a la distribución normal a través del binomio. Una máquina de este tipo hace varios supuestos: 1) el número de contenedores es finito, 2) el árbol subyacente es binario y 3) las probabilidades son fijas. La máquina Quincunx en el Museo de Matemáticas de Nueva York, permite al usuario cambiar dinámicamente las probabilidades. Las probabilidades pueden cambiar en cualquier momento, incluso antes de que finalice la capa actual. De ahí esta idea de que los contenedores no se llenen.
A diferencia de lo que dije en mi respuesta original cuando tienes un vacío en el árbol, la distribución demuestra curtosis.
Estoy mirando esto desde la perspectiva de los sistemas generativos. Yo uso un triángulo para resumir los árboles de decisión. Cuando se toma una nueva decisión, se agregan más contenedores en la base del triángulo y, en términos de distribución, en las colas. Recortar subárboles del árbol dejaría vacíos en la masa de probabilidad de la distribución.
Solo respondí para darte un sentido intuitivo. ¿Etiquetas? Utilicé Excel y jugué con las probabilidades en el binomio y generé los sesgos esperados. No lo he hecho con la curtosis, no ayuda que nos veamos obligados a pensar que la masa de probabilidad es estática al usar el lenguaje que sugiere movimiento. Los datos subyacentes o las bolas causan la curtosis. Luego, lo analizamos de manera diversa y lo atribuimos a la forma de términos descriptivos como centro, hombro y cola. Las únicas cosas con las que tenemos que trabajar son los contenedores. Los contenedores viven vidas dinámicas incluso si los datos no pueden.
fuente