¿Qué es tan 'momento' sobre 'momentos' de una distribución de probabilidad?

65

Sé cuáles son los momentos y cómo calcularlos y cómo usar la función de generación de momentos para obtener momentos de orden superior. Sí, sé las matemáticas.

Ahora que necesito obtener mi conocimiento estadístico lubricado para el trabajo, pensé que bien podría hacer esta pregunta: me ha estado molestando durante unos años y de regreso a la universidad, ningún profesor sabía la respuesta o simplemente rechazaría la pregunta (honestamente) .

Entonces, ¿qué significa la palabra "momento" en este caso? ¿Por qué esta elección de palabra? No me parece intuitivo (o nunca lo escuché así en la universidad :) Ahora que lo pienso, tengo la misma curiosidad con su uso en el "momento de inercia";) pero no nos centremos en eso por ahora.

Entonces, ¿qué significa un "momento" de una distribución y qué busca hacer y por qué ESA palabra! :) ¿Por qué a alguien le importan los momentos? En este momento siento lo contrario sobre ese momento;)

PD: Sí, probablemente he hecho una pregunta similar sobre la varianza, pero valoro la comprensión intuitiva sobre 'buscar en el libro para averiguarlo' :)

Doctor
fuente
55
Para la elección de la palabra, comience con su etimología .
whuber
2
@whuber: ¡sí! Lo busqué antes de hacer esta pregunta, hace muchos años también;)
PhD
Combinaría la etimología proporcionada por @whuber con esta ( thefreedictionary.com/moment ) en la definición de Math / Stat que se cita del Collins English Dictionary. Combinado con definiciones de uso común como "corto período de tiempo" o "instancia específica". Estoy bastante seguro de que ese momento en nuestro sentido matemático / estadístico es intercambiable con puntos. Solo estos puntos tienen un significado particular en ciertas aplicaciones (MGF o MOI) antes de que la geometría y el álgebra de Descartes no tuvieran un vínculo sistemático, por lo que probablemente tenían una variedad de términos diferentes para lo que en realidad son lo mismo.
Chris Simokat
44
Es de Macbeth: " ¿Quién puede ser sabio, asombrado, templado y furioso, leal y neutral, en un momento? " Macbeth: Acto ii. Carolina del Sur. 3
Wolfies

Respuestas:

63

Según el documento "Primera aparición (?) De términos comunes en estadística matemática" por HA David, el primer uso de la palabra "momento" en esta situación fue en una carta de 1893 a la Naturaleza de Karl Pearson titulada "Curvas de frecuencia asimétrica" .

El artículo de Biometrika de 1938 de Neyman "Una nota histórica sobre la deducción de los momentos del binomio de Karl Pearson" ofrece una buena sinopsis de la carta y el trabajo posterior de Pearson sobre los momentos de la distribución binomial y el método de los momentos. Es una muy buena lectura. Espero que tenga acceso a JSTOR porque no tengo tiempo para dar un buen resumen del documento (aunque lo haré este fin de semana). Aunque mencionaré una pieza que puede dar una idea de por qué se utilizó el término "momento". Del artículo de Neyman:

[La memoria de Pearson] trata principalmente de métodos de aproximación de curvas de frecuencia continua por medio de algunos procesos que implican el cálculo de fórmulas fáciles. Una de estas fórmulas consideradas fue el "binomio de punto" o el "binomio con ordenadas cargadas". La fórmula
difiere de lo que hoy llamamos binomio, a saber. (4), solo por un factor , que representa el área bajo la curva continua que se desea ajustar.α

Esto es lo que finalmente condujo al 'método de los momentos'. Neyman repasa la derivación de Pearson de los momentos binomiales en el documento anterior.

Y de la carta de Pearson:

Ahora procederemos a encontrar los primeros cuatro momentos del sistema de rectángulos alrededor de GN. Si la inercia de cada rectángulo pudiera considerarse concentrada a lo largo de su vertical media, deberíamos tener para el momento alrededor de NG, escribiendo . d = c ( 1 + n q )sthd=c(1+nq)

Esto sugiere el hecho de que Pearson usó el término "momento" como una alusión al "momento de inercia", un término común en la física.

Aquí hay un escaneo de la mayoría de las cartas de Pearson Nature :

ingrese la descripción de la imagen aquí

ingrese la descripción de la imagen aquí

Puede ver el artículo completo en la página 615 aquí .

Nick Cox
fuente
1
¿Puedo dar un +100 a esta respuesta? ;)
PhD
55
@Nupul, puedes dar +100 como recompensa. Las recompensas se pueden otorgar cuando la pregunta tiene dos días.
mpiktas
44
@Nupul Observe las múltiples referencias de Pearson a la "gravedad". Claramente está razonando con una analogía física. Esto hace retroceder la pregunta de por qué la física usa el término "momento" para tales cosas. Creo que simplemente es una generalización natural de la idea del momento de inercia (un segundo momento), que encontrará referenciada en los enlaces de etimología para "momento". Por eso la etimología es relevante.
whuber
44
La física reconoce momentos más altos que el segundo, Nupul, y las fórmulas son idénticas a las de las estadísticas. Uno simplemente traduce "densidad" de un objeto en "densidad de probabilidad". De hecho, la física ha generalizado la idea a la de ser un coeficiente de expansión de una serie de potencia en algún sistema de coordenadas apropiado.
whuber
3
@Nupul No sé si puedo agregar algo más de lo que ha dicho Whuber. Estoy pensando que cualquier cosa más allá de lo que he vinculado en mi respuesta y en los comentarios de Whuber probablemente pueda abordarse más a fondo en Physics SE . Y si aún no es lo suficientemente 'profundo', siempre está el SE inglés cuya quinta etiqueta más utilizada es 'etimología'. Pero, gran pregunta! Disfruté investigando y encontré 3 excelentes documentos que nunca supe que existían.
7

Todos tienen su momento en momentos. Tenía el mío en Cumulant y nombres de momentos más allá de la varianza, asimetría y curtosis , y pasé algún tiempo leyendo este hilo gorgioso.

Curiosamente, no encontré la "mención de momento" en el artículo de HA David. Así que fui a Karl Pearson: La vida científica en una era estadística , un libro de TM Porter y Karl Pearson y los orígenes de las estadísticas modernas: un elástico se convierte en estadístico , por ejemplo, editó Una historia de la teoría de la elasticidad y de la resistencia de los materiales desde Galilei hasta la actualidad .

Su experiencia era muy amplia, y era notablemente un profesor de ingeniería y elástico, que estaba involucrado en determinar los momentos de flexión de un tramo de puente y calcular el estrés en las presas de mampostería. En elasticidad, uno solo observa lo que está sucediendo (ruptura) de manera limitada. Aparentemente estaba interesado en (del libro de Porter):

cálculo gráfico o, en su forma más digna y matemática, estática gráfica.

Más tarde :

Desde el comienzo de su carrera estadística, e incluso antes de eso, ajustó las curvas utilizando el "método de los momentos". En mecánica, esto significaba hacer coincidir un cuerpo complicado con uno simple o abstracto que tuviera el mismo centro de masa y "radio de giro", respectivamente, el primer y el segundo momento. Estas cantidades corresponden en estadística a la media y a la dispersión o dispersión de las mediciones alrededor de la media.

Y desde:

Pearson trató en intervalos de medición discretos, esto fue una suma en lugar de una integral

Los momentos de inercia pueden representar un resumen de un cuerpo en movimiento: los cálculos se pueden llevar a cabo como si el cuerpo se redujera a un solo punto.

Pearson estableció estas cinco igualdades como un sistema de ecuaciones, que se combinaron en uno de noveno grado. Una solución numérica solo fue posible mediante aproximaciones sucesivas. Podría haber hasta nueve soluciones reales, aunque en el presente caso solo había dos. Graficaba ambos resultados junto con el original, y en general estaba satisfecho con la apariencia del resultado. Sin embargo, no confió en la inspección visual para decidir entre ellos, sino que calculó el sexto momento para decidir el mejor partido.

Volvamos a la física. Un momento es una cantidad física que tiene en cuenta la disposición local de una propiedad física, generalmente con respecto a un determinado punto o eje ordinal (clásicamente en el espacio o el tiempo). Resume las cantidades físicas medidas a cierta distancia de una referencia. Si la cantidad no se concentra en un solo punto, el momento se "promedia" en todo el espacio, por medio de integrales o sumas.

Aparentemente, el concepto de momentos se remonta al descubrimiento del principio operativo de la palanca "descubierta" por Arquímedes. Una de las primeras ocurrencias conocidas es la palabra latina "momentorum" con el sentido actual aceptado (momento sobre un centro de rotación). En 1565, Federico Commandino tradujo el trabajo de Arquímedes (Liber de Centro Gravitatis Solidorum) como:

El centro de gravedad de cada figura sólida es ese punto dentro de él, sobre el cual se ubican en todos los lados partes del mismo momento.

o

Centrum gravitatis uniuscuiusque solidae figurae est punctum illud intra positum, circa quod undique partes aequalium momentorum

Entonces, aparentemente, la analogía con la física es bastante fuerte: a partir de una forma física discreta complicada, encuentre cantidades que se aproximen lo suficiente, una forma de compresión o parsimonia.

Laurent Duval
fuente
6

Siendo demasiado simplista, los momentos estadísticos son descriptores adicionales de una curva / distribución. Estamos familiarizados con los primeros dos momentos y estos son generalmente útiles para distribuciones normales continuas o curvas similares. Sin embargo, estos dos primeros momentos pierden su valor informativo para otras distribuciones. Por lo tanto, otros momentos proporcionan información adicional sobre la forma / forma de la distribución.

Daniel I Shostak
fuente
1
No creo que el significado de los dos primeros momentos pierda sentido para todas las distribuciones no normales, por ejemplo, el tiempo medio de residencia es generalmente el primer momento o el promedio integral de tiempos en una serie de tiempo.
Carl
5

Pregunta: Entonces, ¿qué significa la palabra "momento" en este caso? ¿Por qué esta elección de palabra? No me parece intuitivo (o nunca lo escuché así en la universidad :) Ahora que lo pienso, tengo la misma curiosidad con su uso en el "momento de inercia";) pero no nos centremos en eso por ahora.

Respuesta: En realidad, en un sentido histórico, el momento de inercia es probablemente de donde proviene el sentido de la palabra momentos. De hecho, uno puede (como a continuación) mostrar cómo el momento de inercia se relaciona con la varianza. Esto también produce una interpretación física de los momentos superiores.

En física, un momento es una expresión que involucra el producto de una distancia y una cantidad física, y de esta manera explica cómo se ubica u organiza la cantidad física. Los momentos generalmente se definen con respecto a un punto de referencia fijo; tratan con cantidades físicas medidas a cierta distancia de ese punto de referencia. Por ejemplo, el momento de fuerza que actúa sobre un objeto, a menudo llamado torque, es el producto de la fuerza y ​​la distancia desde un punto de referencia, como en el siguiente ejemplo.

ingrese la descripción de la imagen aquí

Menos confusos que los nombres usualmente dados , por ejemplo, hiperplanitud, etc. para momentos más altos serían momentos de movimiento circular, por ejemplo, momentos de inercia para movimiento circular , de cuerpos rígidos, que es una conversión simple. La aceleración angular es la derivada de la velocidad angular, que es la derivada del ángulo con respecto al tiempo, es decir, . Considere que el segundo momento es análogo al par aplicado a un movimiento circular, o si va a realizar una aceleración / desaceleración (también segunda derivada) de esa circular (es decir, angular,dωdt=α,dθdt=ωθ) movimiento. De manera similar, el tercer momento sería una tasa de cambio de torque, y así sucesivamente durante momentos aún más altos para hacer tasas de cambio de tasas de cambio de tasas de cambio, es decir, derivadas secuenciales de movimiento circular. Quizás sea más fácil visualizar esto con ejemplos reales.

Existen límites para la plausibilidad física, por ejemplo, donde un objeto comienza y termina, es decir, su soporte, lo que hace que la comparación sea más o menos realista. Tomemos el ejemplo de una distribución beta, que tiene soporte (finito) en [0,1] y muestremos la correspondencia para eso. La función de densidad de distribución beta ( pdf ) es donde y es la función gamma , .

β(x;α,β)={xα1(1x)β1B(α,β)0<x<10True,
B(α,β)=Γ(α)Γ(β)Γ(α+β)Γ(.)Γ(z)=0xz1exdx

La media es entonces el primer momento de rotación alrededor del eje para la función beta trazada como una lámina delgada de rotación rígida de densidad de área uniforme con el valor mínimo fijado al origen (0,0,0), con su base en el plano . como se ilustra para , es decir, , a continuación zxx,y

μ=01rβ(r;α,β)dr=αα+β,
β(r;2,2)μ=12ingrese la descripción de la imagen aquí

Tenga en cuenta que no hay nada que nos impida mover la hoja delgada de distribución beta a otra ubicación y volver a escalarla, por ejemplo, de a , o cambiar la forma vertical, por ejemplo, para que sea una pala en lugar de una joroba.0r12r4

Para calcular la varianza de la distribución beta, calcularíamos el momento de inercia para una distribución beta desplazada con la media del valor colocada en el eje de rotación, que para , es decir, , donde es el momento de inercia, se ve así,rzβ ( r ; 2 , 2 ) I = σ 2 = 1

σ2=01(rμ)2β(r;α,β)dr=αβ(α+β)2(α+β+1),
β(r;2,2) II=σ2=120I

ingrese la descripción de la imagen aquí

Ahora para los llamados momentos 'centrales' más altos , es decir, momentos sobre la media, como la asimetría y la curtosis, calculamos el momento alrededor de la media desde Esto también puede entenderse como la derivada del movimiento circular.1 0 ( r - μ ) n β ( r ; α , β )nthn th

01(rμ)nβ(r;α,β)dr.
nth

¿Qué sucede si queremos calcular al revés, es decir, tomar un objeto sólido 3D y convertirlo en una función de probabilidad? Las cosas se ponen un poco más complicadas. Por ejemplo, tomemos un toro . ingrese la descripción de la imagen aquí

Primero tomamos su sección transversal circular, luego la convertimos en media elipse para mostrar la densidad de cualquier moneda plana como rebanada, luego convertimos la moneda en una moneda en forma de cuña para tener en cuenta la densidad creciente con la distancia creciente ( ) del eje , y finalmente normalizamos para que el área realice una función de densidad. Esto se describe gráficamente a continuación con las matemáticas que quedan para el lector.zrz

ingrese la descripción de la imagen aquí

Finalmente, preguntamos cómo se relacionan estas equivalencias con el movimiento. Tenga en cuenta que, como arriba del momento de inercia, , puede relacionarse con el segundo momento central, , AKA, la varianza. Entonces , es decir, la relación del par, y la aceleración angular, . Luego nos diferenciaríamos para obtener tasas de cambio de orden más altas en el tiempo.σ 2 I = τIσ2 τaI=τaτa

Carl
fuente
La conexión entre momentos y derivados es oscura. (Definitivamente existe, pero la relación generalmente se revela a través de la Transformada de Fourier). ¿Podría mostrar explícitamente cómo y por qué los momentos pueden interpretarse como derivados? ¿Como funciona esto?
whuber
@whuber Más tarde, mientras tanto, mire el enlace de momentos anterior, muestra ||.
Carl
Gracias. Veo esa página y entiendo a qué se refiere, pero la conexión con los momentos de una distribución no está clara. Estoy intrigado y espero con interés su posterior elaboración de esta idea.
whuber
@whuber Revíselo y vea si está de acuerdo.
Carl
2
Sí, eso se puede hacer. Cuando el argumento de la serie se escribe como entonces tienes una serie de Fourier. Además, la conexión entre momentos y derivadas es explícita en la transformación de Fourier: el operador de diferenciación se transforma en multiplicación por , mostrando directamente cómo los momentos están conectados a derivadas del mismo orden. x = e i q qxx=eiqq
whuber