Cómo probar si existe la media de una función de densidad de probabilidad

9

Es bien sabido que dada una variable aleatoria de valor real con pdf , la media de (si existe) se encuentra por XfX

E[X]=Rxf(x)dx.

Pregunta general: Ahora, si uno no puede resolver la integral anterior en forma cerrada, pero simplemente desea determinar si la media existe y es finita, ¿hay alguna forma de demostrarlo? ¿Hay (quizás) alguna prueba que pueda aplicar al integrando para determinar si se cumplen ciertos criterios para que exista la media?

Pregunta específica de la aplicación: Tengo el siguiente pdf para el que quiero determinar si existe la media:

f(x)=|σ22μ1x+μ2σ12|σ13σ23a3(x)ϕ(μ2xμ1σ1σ2a(x))for xR,

donde , , , y .μ1,μ2Rσ1,σ2>0a(x)=(x2σ12+1σ22)1/2ϕ(g(x))=12πeg2(x)/2

He tratado de resolver el medio en vano.

Aaron Hendrickson
fuente
1
en su pregunta específica no es una función de densidad adecuada. supongamos que , y , , luego para . f(x)μ1=1μ2=0σj=1j=1,2f(x)<0x<0
EliKa
@EliKa Buen hallazgo. Puede haber un error tipográfico. Comprobaré y corregiré la pregunta. Dicho esto, todavía estoy interesado principalmente en la parte del "cómo" de la pregunta, es decir, ¿cómo podría determinar si la media existe y es finita?
Aaron Hendrickson
2
Usted podría tratar de delimitación encima y por debajo por algunas funciones no negativas y tales que puede integrarlos. Si puede integrar , entonces su distribución tiene una media. Si , entonces su distribución no tiene ninguna media. |xf(x)|u(x)b(x)u(x)b(x)dx=
Ceph
@Ceph Esa es una buena sugerencia. ¿Se basa esa técnica en el "teorema de compresión"?
Aaron Hendrickson
1
@AaronHendrickson Idea similar, pero (según tengo entendido) el teorema de compresión es un poco diferente. Utilizando el ST aquí podría tener este aspecto: encontrar y que une (en lugar de saltando como en mi comentario anterior) de tal manera que usted puede encontrar , donde es la media de su distribución. Pero eso probablemente no sea una estrategia plausible, ya que sería difícil encontrar tales y . (Podrían diferir de solo en un conjunto de medida 0 y, por lo tanto, probablemente no sería más fácil de integrar que ).u(x)b(x)xf(x)|xf(x)|u(x)dx=b(x)dx=μμubxf(x)xf(x)
Ceph

Respuestas:

12

No existe una técnica general, pero hay algunos principios simples. Una es estudiar el comportamiento de la cola de comparándolo con funciones manejables.f

Por definición, la expectativa es el doble límite (ya que y varían independientemente)yz

Ey,z[f]=limy,zyzxf(x)dx=limyy0xf(x)dx+limz0zxf(x)dx.

El tratamiento de las dos integrales a la derecha es el mismo, así que centrémonos en el positivo. Un comportamiento de que asegura un valor límite es compararlo con la potencia . Supongamos que es un número para el cual Esto significa que existe un y un para el cual siempre que . Podemos explotar esta desigualdad rompiendo la integración en las regiones donde y y aplicándola en la segunda región:fxpp

lim infxxpf(x)>0.
ϵ>0N>1xpf(x)ϵx[N,)x<NxN

0zxf(x)dx=0Nxf(x)dx+Nzxf(x)dx=0Nxf(x)dx+Nzx1p(xpf(x))dx0Nxf(x)dx+Nzx1p(ϵ)dx=0Nxf(x)dx+ϵ2p(z2pN2p).

Siempre que , el lado derecho diverge como . Cuando la integral se evalúa al logaritmo,p<2zp=2

Nzx12(ϵ)dx=ϵ(log(z)log(N)),

que también diverge.

Un análisis comparable muestra que si para , entonces existe. De manera similar, podemos probar si existe algún momento de : para , la expectativa de existe cuando para algunos y no existe cuando para algunos . Esto aborda la "pregunta general".|x|pf(x)0p>2E[X]Xα>0|X|α|x|p+αf(x)0p>1lim inf|x|p+αf(x)>0p1

Apliquemos esta idea a la pregunta. Por inspección queda claro que para grande. Al evaluar , por lo tanto, podemos descartar cualquier término aditivo que eventualmente se verá afectado por. Por lo tanto, hasta una constante distinta de cero, paraa(x)|x|/σ1|x|f|x|x>0

f(x)μ1xσ2x3ϕ(μ2xσ2x)=x2μ1σ2exp((μ22σ2)2).

Por lo tanto, aproxima a una constante distinta de cero. Por el resultado anterior, la expectativa diverge.x2f(x)

Dado que es el valor más pequeño de que funciona en este argumento-- irá a cero como para cualquier - está claro (y un más el análisis detallado de confirmará) que la tasa de divergencia es logarítmica. Es decir, para grandesy, puede aproximarse estrechamente mediante una combinación lineal de y .2p|x|pf(x)|x|p<2f|y||z|Ey,z[f]log(|y|)log(|z|)

whuber
fuente