¿La media de una variable aleatoria univariante siempre es igual a la integral de su función cuantil?

17

Acabo de notar que la integración de la función cuantil de una variable aleatoria univariada (cdf inverso) de p = 0 a p = 1 produce la media de la variable. No he oído hablar de esta relación hasta ahora, así que me pregunto: ¿es este siempre el caso? Si es así, ¿se conoce ampliamente esta relación?

Aquí hay un ejemplo en python:

from math import sqrt
from scipy.integrate import quad
from scipy.special import erfinv

def normalPdf(x, mu, sigma):
    return 1.0 / sqrt(2.0 * pi * sigma**2.0) * exp(-(x - mu)**2.0 / (2.0 * sigma**2.0))

def normalQf(p, mu, sigma):
    return mu + sigma * sqrt(2.0) * erfinv(2.0 * p - 1.0)

mu = 2.5
sigma = 1.3
quantileIntegral = quad(lambda p: quantile(p,mu,sigma), 0.0, 1.0)[0]
print quantileIntegral # Prints 2.5.
Tyler Streeter
fuente

Respuestas:

26

Sea el CDF de la variable aleatoria , de modo que el CDF inverso se pueda escribir . En su integral haga la sustitución , para obtenerX F - 1 p = F ( x ) d p = F ( x ) d x = f ( x ) d xFXF1p=F(x)dp=F(x)dx=f(x)dx

01F1(p)dp=xf(x)dx=EF[X].

Esto es válido para distribuciones continuas. Se debe tener cuidado con otras distribuciones porque un CDF inverso no tiene una definición única.

Editar

Cuando la variable no es continua, no tiene una distribución que sea absolutamente continua con respecto a la medida de Lebesgue, lo que requiere cuidado en la definición de CDF inverso y cuidado en integrales informáticas. Considere, por ejemplo, el caso de una distribución discreta. Por definición, este es uno cuyo CDF es una función de paso con pasos de tamaño en cada valor posible .FxPrF(x)x

Figura 1

Esta figura muestra el CDF de una distribución de Bernoulli escalada en . Es decir, la variable aleatoria tiene una probabilidad de de igualar y una probabilidad de de igualar . Las alturas de los saltos en y dan sus probabilidades. La expectativa de esta variable evidentemente es igual a .2 1 / 3 0 2 / 3 2 0 2 0 × ( 1 / 3 ) + 2 × ( 2 / 3 ) = 4 / 3(2/3)21/302/32020×(1/3)+2×(2/3)=4/3

Podríamos definir un "CDF inverso" requiriendoF1

F1(p)=x if F(x)p and F(x)<p.

Esto significa que también es una función de paso. Para cualquier valor posible de la variable aleatoria, alcanzará el valor en un intervalo de longitud . Por lo tanto, su integral se obtiene sumando los valores , que es solo la expectativa. x F - 1 x Pr F ( x ) x Pr F ( x )F1xF1xPrF(x)xPrF(x)

Figura 2

Este es el gráfico del CDF inverso del ejemplo anterior. Los saltos de y en el CDF se convierten en líneas horizontales de estas longitudes a alturas iguales a y , los valores a cuyas probabilidades corresponden. (El CDF inverso no se define más allá del intervalo .) Su integral es la suma de dos rectángulos, uno de altura y base , el otro de altura y base , totalizando , como antes.2 / 3 0 2 [ 0 , 1 ] 0 1 / 3 2 2 / 3 4 / 31/32/302[0,1]01/322/34/3

En general, para una mezcla de una distribución continua y una discreta, necesitamos definir el CDF inverso para que sea paralela a esta construcción: en cada salto discreto de altura debemos formar una línea horizontal de longitud como se indica en la fórmula anterior.ppp

whuber
fuente
cometiste un error en el cambio de variable. ¿De dónde viene la x?
Mascarpone
3
@Mascarpone Lea el texto que precede a la ecuación. No creo que haya un error en el cambio de variable :-), pero si cree que aclararía la exposición, me complacería señalar que cuando , entonces . Simplemente no pensé que fuera necesario. x = F - 1 ( p )p=F(x)x=F1(p)
whuber
ahora lo tengo;),
Mascarpone
+1 Whuber: ¡Gracias! ¿Podría elaborar para utilizar la fórmula que dio, cómo cuidar otras distribuciones cuyo CDF inverso no tiene una definición única?
StackExchange para todos el
1
Para evitar tales inquietudes consideraciones sobre inversas, pseudo-inversas y similares, y simultáneamente para una generalización a cada momento, vea aquí .
Hizo el
9

Un resultado equivalente es bien conocido en el análisis de supervivencia : la vida útil esperada es donde la función de supervivencia es medida desde el nacimiento en . (Se puede ampliar fácilmente para cubrir valores negativos de ).S ( t ) = Pr ( T > t ) t = 0 t

t=0S(t)dt
S(t)=Pr(T>t)t=0t

ingrese la descripción de la imagen aquí

Entonces podemos reescribir esto como pero esto es como se muestra en varias reflexiones del área en cuestión1 q = 0 F - 1 ( q )

t=0(1F(t))dt
q=01F1(q)dq

ingrese la descripción de la imagen aquí

Enrique
fuente
1
Me gustan las imágenes, e instintivamente siento que hay una gran idea al acecho aquí, me encanta la idea, pero no entiendo estas en particular. Las explicaciones serían útiles. Una cosa que me detiene es la idea de tratar de extender la integral de a : tiene que divergir. - (1F(t))dt
whuber
@whuber: Si desea extender a negativo , obtiene . Tenga en cuenta que si esto converge para una distribución simétrica sobre , es decir, entonces es fácil ver que la expectativa es cero. Tomar una suma en lugar de una diferencia da la desviación absoluta promedio de aproximadamente . tt=0(1F(t))dtt=0F(t)dt0F(t)=1F(t)0t=0(1F(t))dt+t=0F(t)dt0
Henry
Si le gustan los diagramas, quizás le interese este artículo de 1988 de Lee: The Mathematics of Excess of Loss Coverage y Retrospective Rating-A Graphical Approach .
Avraham
4

Estamos evaluando:

ingrese la descripción de la imagen aquí

Probemos con un simple cambio de variable:

ingrese la descripción de la imagen aquí

Y notamos que, por definición de PDF y CDF:

ingrese la descripción de la imagen aquí

Casi en cualquier parte. Así tenemos, por definición del valor esperado:

ingrese la descripción de la imagen aquí

Mascarpone
fuente
En la línea final explico más claramente la definición del valor esperado. Casi en todas partes se refiere a la ecuación anterior a la última. en.wikipedia.org/wiki/Almost_everywhere
Mascarpone
1
editado, gracias :)
Mascarpone
3

Para cualquier variable aleatoria de valor real con cdf F , es bien sabido que F - 1 ( U ) tiene la misma ley que X cuando U es uniforme en ( 0 , 1 ) . Por lo tanto, la expectativa de X , siempre que exista, es la misma que la expectativa de F - 1 ( U ) : E ( X ) = E ( F - 1 ( U ) ) =XF F1(U)XU(0,1)XF1(U) La representaciónX F - 1 (U)es válida para un cdf generalF, tomando F - 1 como el inverso continuo a la izquierda deFen el caso de queFno sea invertible.

E(X)=E(F1(U))=01F1(u)du.
XF1(U)FF1FF
Stéphane Laurent
fuente
1

Tenga en cuenta que se define como P ( X x ) y es una función continua derecha. F - 1 se define como F - 1 ( p ) = min ( x | F ( x ) p ) . El mínimo tiene sentido debido a la continuidad correcta. Sea U una distribución uniforme en [ 0 , 1 ] . Puede verificar fácilmente que FF(x)P(Xx)F1

F1(p)=min(x|F(x)p).
minU[0,1]tiene el mismo CDF comoX, que esF. Esto no requiere queXsea ​​continua. Por lo tanto,E(X)=E( F - 1 (U))=1 0 F - 1 (p) d p . La integral es laintegral de Riemann – Stieltjes. La única suposición que necesitamos es queexistala media deX(E | X | <F1(U)XFXE(X)=E(F1(U))=01F1(p)dpX ).E|X|<
WWang
fuente
Esa es la misma respuesta que la mía.
Stéphane Laurent