¿Ejemplo de cálculo de la expectativa de un RV discreto utilizando Riemann-Stieltjes integral?

8

La notación integral de Riemann-Stieltjes se usa en expresiones de expectativa en algunos textos de probabilidad. Básicamente, dF (x) aparece en la integral en lugar de f (x) dx en la integral, ya que el CDF F (x) puede no ser diferenciable para una distribución discreta.

La motivación que he escuchado para esto generalmente es proporcionar una definición unificada de expectativa en lugar de tratarla con un caso discreto y un caso continuo. También se supone que hace que sea más fácil pensar en mezclas discretas y continuas. Pero nunca he visto un ejemplo de cálculo de una expectativa con una integral de Riemann-Stieltjes para una distribución discreta (o para una distribución que es una mezcla de una masa de puntos y una distribución continua).

¿Alguien puede dar un ejemplo de ambos o cualquiera? ¡Gracias!

Frelk
fuente
3
Una búsqueda en nuestro sitio de "Stieltjes" arrojará ejemplos. Por ejemplo, calculo tal integral en stats.stackexchange.com/a/108220 . (Aunque me refiero a él como una integral de Legesgue-Stieltjes allí, esa generalización no es necesaria y el cálculo claramente funciona para las integrales de Riemann-Stieltjes). Ese ejemplo particular se refiere a una distribución que no es continua ni discreta.
whuber

Respuestas:

12

Como no parece que haya hecho mucho con la integral, voy a discutir esto de una manera muy elemental (y ligeramente ondulada) que debería transmitir algo de lo que sucede. Sin embargo, es posible que desee comenzar con un recordatorio, echando un vistazo a la definición de una integral de Stieltjes, consulte, por ejemplo, Mathworld o Wikipedia . Hacer las integrales correctamente implica considerar el límite en la definición, y en las ocasiones en que no es obvio, eso es realmente lo que debe hacer.

Si la distribución es puramente discreta, entonces es 0 excepto en los saltos, donde es , por lo que para casos discretos la integral es literalmente la suma usual.dFp(x)

Solo como ejemplo, considere un Bernoulli (0.4).

! [ingrese la descripción de la imagen aquí

Entonces, para este ejemplo, . (Eso no es solo "son iguales en valor" sino "esas cosas son diferentes formas de expresar la misma cosa"; probablemente debería usar un símbolo más apropiado).E(X)=xdF=xxp(x)

Entonces, aquí es todas partes pero en (donde es ) (donde es ). Entonces esa expresión es solodF0x=0dF0.6x=10.400.6+10.4 .

Si bien la unificación de fórmulas discretas y continuas es ordenada, no es realmente donde la mayor parte de su valor viene a mi mente. Veo más valor en el hecho de que se aplica a casos en los que no tiene variables aleatorias discretas ni continuas, y hay muchos casos en los que eso es algo que se encuentra con datos reales, por lo que no es un problema teórico esotérico. Tener una notación que pueda lidiar sin problemas con esos casos "ni discretos ni continuos", así como con los casos especiales discretos y continuos, todo al mismo tiempo, ahí es donde hay algún beneficio real.

Tomemos un caso simple y agradable que no sea, por ejemplo, una distribución de lluvia diaria para un mes y lugar determinados, tal vez modelada como una mezcla de una probabilidad de 0.6 de lluvia cero, y cantidades de lluvia no cero siendo lognormal(μ,σ2) (dónde μ=1.384,y σ=1.823) (que podría denominarse modelo "lognormal cero inflado")

ingrese la descripción de la imagen aquí

Entonces, en este caso, una integral como la de la expectativa, E(X)=xdF puede tratarse con bastante facilidad, porque funciona como la definición discreta hasta ese salto (y solo agregando x.p(x) en el salto, que resulta agregar 0 a la integral, ya que todo eso 0.6 la probabilidad estaba en x=0) y luego en este caso en todas partes arriba 0 (porque la función es lo suficientemente buena como para que Stieltjes sea la misma que Riemann ordinaria) el resto funciona como una integral de Riemann de xf(x) encima 0, siempre y cuando tengamos en cuenta que dF es más pequeño de lo que sería para lognormal (arriba 0 puedes ver F está "aplastado" en relación con un cdf puramente lognormal), lo que representa exactamente la probabilidad (0.4) de exceder 0 aquí.

Por supuesto, esto funciona bien para más que solo g(x)=x; Solo estoy tomando casos simples para mostrar un poco de lo que está sucediendo. (Whuber señaló un buen ejemplo en los comentarios, donde hace un cálculo de MGF para un problema no simple, donde la distribución termina como una distribución mixta)

Incluso con estas funciones muy agradables (donde puedes tratarlas como Riemann donde son continuas, que es un subconjunto de los casos cubiertos por Stieltjes) hay infinidad de casos en tales mezclas (en lugar de solo 'discreto' o 'continuo' ) que se puede manejar con esta notación.

Una referencia útil que usa ampliamente esta integral para mostrar o discutir una variedad de resultados es la Teoría avanzada de estadística (Kendall y Stuart, o en ediciones más recientes, Stuart y Ord). No dejes que el título te asuste, es un libro muy legible.

Entonces, si (por ejemplo) juega con integrales mientras observa, por ejemplo, una desigualdad de Chebyshev, no solo está haciendo un caso discreto y un caso continuo al mismo tiempo ... está cubriendo cualquier distribución para la que la integral de Stieltjes funcione - Entonces, si se pregunta qué sucede en Chebyshev si tiene una distribución como decir que la lluvia, he aquí, todo se ocupa de ese mismo desarrollo. Y si mañana, tu amigo aparece con una beta inflada cero-uno, bueno, ya lo cubriste también. Y así ...

[Si te encuentras en una situación en la que no puedes ver de inmediato lo que significa la integral, vuelve a la definición y síguela.]

(Esta integral agradable puede ser reemplazada por cosas que son capaces de manejar situaciones aún más amplias, con fines estadísticos, generalmente a la integral de Lebesgue o Lesbesgue-Stieltjes )

Glen_b -Reinstate a Monica
fuente
1
Gracias, eso es muy útil. Cualquier ejemplo del caso "ni discreto ni continuo" sería muy apreciado, ya que esto parece ser la mayor parte del valor de esta notación (a menudo desagradable).
frelk