¿Cómo explicaría la función de generación de momentos (MGF) en términos simples?

15

¿Qué es una función generadora de momentos (MGF)?

¿Puede explicarlo en términos simples y junto con un ejemplo simple y fácil?

Por favor, limite el uso de anotaciones matemáticas formales tanto como sea posible.

usuario366312
fuente
1
¿Quieres un ejemplo simple y fácil ... pero sin notación matemática? No estoy seguro de que tal cosa sea muy fácil de hacer, al menos no sin arriesgarse a dar una impresión engañosa de lo que está tratando. Supongo que uno podría dar el mgf de una variable aleatoria degenerada que siempre es 0 sin necesidad de mucha notación matemática, pero será poco esclarecedor si realmente quiere entender mgfs.
Glen_b -Reinstate Monica
1
No estoy seguro de si hay una forma intuitiva de entenderlo, podría pensar que es una forma de "codificar" una distribución (al menos cuando existe, esta idea funciona un poco mejor con funciones características).
dsaxton
1
Una función generadora de momentos, cuando existe, es una forma de codificar todos los momentos enteros no negativos de una variable aleatoria en una función, y de los cuales pueden extraerse nuevamente; mgfs se puede usar para hacer cálculos particulares que a veces no son tan fáciles de hacer de otras maneras. No espero que sea de mucha ayuda.
Glen_b -Reinstate Monica
1
Estoy seguro de que has visto a Joe Blitztein responder a la misma pregunta sobre Quora
Antoni Parellada el

Respuestas:

18

Supongamos que no es posible una intuición libre de ecuaciones, y aún insistimos en reducir las matemáticas a lo esencial para tener una idea de lo que está sucediendo: estamos tratando de obtener los momentos estadísticos que, después de la referencia obligatoria a la física , definimos como el valor esperado de una potencia de una variable aleatoria. Para una variable aleatoria continua, el momento k procesar es por LOTO :

(1)E[Xk]=Xkpdfdx

La función generadora de momentos ,

MX(t):=E[etX],
es una forma de caminar alrededor de esta integral (Ec. 1) , en su lugar, realizando:

(2)E[etX]=etXpdfdx

¿Por qué? Porque es más fácil y hay una propiedad fantástica del MGF que se puede ver expandiendo la serie Maclaurin de etX

etX=1+X1!t+X22!t2+X33!t3+

Tomando la expectativa de ambos lados de esta serie de poder:

MX(t)=E[etX](3)=1+E[X]1!t+E[X2]2!t2+E[X3]3!t3+

los momentos aparecen "encaramados" en este "tendedero" polinómico, listos para ser seleccionados simplemente diferenciando k veces y evaluando en cero una vez que pasamos por la integración más fácil (en la ecuación (2)) ¡ solo una vez para todos los momentos! El hecho de que es una integración más fácil es más evidente cuando el pdf es exponencial.

Para recuperar el k -ésimo momento:

MX(k)(0)=dkdtkMX(t)|t=0

El hecho de que eventualmente sea necesario diferenciarlo hace que no sea un almuerzo gratis; al final, es una transformación de Laplace a doble cara del pdf con un signo cambiado en el exponente:

L{pdf(x)}(s)=esxpdf(x)dx

tal que

(4)MX(t)=L{pdf(x)}(s).

Esto, en efecto, nos da una vía física a la intuición. La transformación de Laplace está actuando sobre el pdf y descomponiéndolo en momentos. La similitud con una transformación de Fourier es inevitable : un FT asigna una función a una nueva función en la línea real, y Laplace asigna una función a una nueva función en el plano complejo. La transformada de Fourier expresa una función o señal como una serie de frecuencias, mientras que la transformada de Laplace resuelve una función en sus momentos . De hecho, una forma diferente de obtener momentos es a través de una transformada de Fourier ( función característica ). El término exponencial en la transformada de Laplace es en general de la forma est cons=σ+iω , correspondiente a losexponenciales reales y sinusoidales imaginarios, y arrojando gráficos comoeste:


[ De la Guía del científico e ingeniero para el procesamiento de señales de Steven W. Smith ]


Por lo tanto, la función MX(t) descompone el pdf alguna manera en sus "frecuencias constituyentes" cuando σ=0. De la ecuación. (4):

MX(t)=E[esX]=esxpdf(x)dx=e(σ+iω)xpdf(x)dx=eσxeiωxpdf(x)dx

lo que nos deja con la integral impropia de la parte de la expresión en rojo, correspondiente a la transformada de Fourier del pdf.

En general, la intuición de los polos de transformación de Laplace de una función sería que proporcionan información de los componentes exponenciales (decaimiento) y de frecuencia de la función (en este caso, el pdf).


Xketx(1)(2)k(2)k(3)0

Antoni Parellada
fuente
2
E[etX]E[Xk]
2
Ojalá los legos que entendieran esta respuesta fueran mis alumnos :)
Aksakal
3

M(t)=etμ+1/2σ2t2
ddtM(t)|t=0=μ+σ2t|t=0=μ

Además, dado que este MGF codifica todo sobre la distribución, si sabe cómo manipular la función, ¡puede aplicar operaciones en todas las características de la distribución a la vez! ¿Por qué no siempre usamos MGF? Primero, no es en todas las situaciones que el MGF es la herramienta más fácil. En segundo lugar, MGF no siempre existe.

Por encima de laico

f(x)=12πex2/2

Puede calcular su momento, como la media y la desviación estándar, y usarlo en variables transformadas y funciones en normales aleatorias, etc.

Puede pensar en el MGF de distribución normal como una alternativa al PDF. Contiene la misma cantidad de información. Ya mostré cómo obtener la media.

σ2=x212πex2/2dx=?
M(t)=et2/2
σ2=d2dt2M(t)|t=0=ddtt|t=0=1

Aksakal
fuente
1
¿Puede ampliar el "todo" que codifica sobre la distribución?
ColorStatistics
2
Para apreciar el comentario de @ColorStatistics, consulte stats.stackexchange.com/questions/25010 .
whuber
@whuber: Gracias, whuber. Estudiaré esa referencia. Este es un tema que estoy buscando entender mejor.
ColorStatistics
¿Cómo podemos demostrar que MGF y PDF contienen la misma cantidad de información?
Aerin