¿Por qué funciona la convolución?

11

Entonces sé que si queremos encontrar la distribución de probabilidad de una suma de variables aleatorias independientes X+Y , podemos calcularla a partir de las distribuciones de probabilidad de X e Y , diciendo

fX+Y(a)=x=fX,Y(X=x,Y=ax) dx=x=fX(x)fY(ax) dx

Intuitivamente, esto tiene sentido, porque si queremos encontrar la probabilidad de que dos variables aleatorias sumen a a , es básicamente la suma de las probabilidades de todos los eventos que conducen a que esas variables sumen a a . Pero, ¿cómo puedo probar formalmente esta afirmación?

Jessica
fuente
Pregunta ligeramente diferente, pero la respuesta es similar .
Carl

Respuestas:

10

La solución más general considera Z=X+Y donde X e Y no son necesariamente independientes. Una estrategia de solución común para problemas en los que se pregunta de dónde vino un PDF o cómo justificarlo, es encontrar un acumulativo probablemente en su lugar, luego diferenciarlo para reducir el CDF a un PDF.

Es bastante fácil ver que en ese caso donde R es la región delplano x - y para el que x + y z .FZ(z)=P(Zz)=RfX,Y(x,y)dxdyRxyx+yz

Esta es la región sombreada en azul en el siguiente diagrama. Es natural integrarse sobre esta región dividiéndola en tiras; lo he hecho con tiras verticales, pero las horizontales funcionarán. Efectivamente, termino con una tira para cada coordenada , que varía de - a , y a lo largo de cada tira quiero que los valores de y no se eleven por encima de la línea x + y = z , entonces y z - x .xyx+y=zyzx

z <x + y

xyu=xv=x+yzv

FZ(z)=x=x=y=y=zxfX,Y(x,y)dxdy=v=v=zu=y=fX,Y(u,vu)dudv

z

fZ(z)=fX,Y(u,zu)du

XY

fZ(z)=fX(u)fY(zu)du

ux

Mi notación para las integrales sigue exactamente la Sección 6.4 de Geoffrey Grimmett y Dominic Walsh, Probability: An Introduction , Oxford University Press, Nueva York, 2000.

Lepisma
fuente
x y ( d x ) d ydxdyxy(dx)dy
1
@whuber, pensando en eso, esa es ciertamente la convención que se aplica en casi todos los libros de texto que conozco (por lo que la integración múltiple es integrales efectivamente anidadas). Pero hojeando, Grimmett y Welsh "Probability: An Introduction" son absolutamente consistentes con su propia convención del mismo orden izquierda-derecha para límites y diferenciales, por ejemplo, dan ! uvw...dudvdw
Silverfish
Me divierte constantemente cómo, en la intersección de muchos campos, estamos expuestos a convenciones conflictivas. Es una de las alegrías de trabajar con personas de diferentes orígenes.
whuber
@whuber Soy consciente de que las convenciones para establecer integrales varían enormemente de un país a otro; lo disfrutará de Tex SE tex.stackexchange.com/a/88961/25866 y ¡desearía que se ampliara para cubrir la integración múltiple!
Silverfish
10

La afirmación es verdadera si y solo si el lado derecho actúa como una densidad para ; es decir,X+Y

FX+Y(a)=P(X+Ya)=afX+Y(z)dz=a(fX(x)fY(zx)dx)dz

por todo . Verifiquemos esto comenzando con el lado derecho.a

Aplica el Teorema de Fubini para cambiar el orden de integración y hacer la sustitución . El determinante de su jacobiano es , por lo que este cambio de variables no introduce términos adicionales. Tenga en cuenta que debido a que e están en correspondencia uno a uno y if y solo if , podemos reescribir la integral comoz=x+y1zy<za<y<ax

=(axfX(x)fY(y)dy)dx.

Por definición, esta es la integral sobre deR2

=I(x+ya)fX(x)fY(y)dydx

donde es la función indicadora de un conjunto. Finalmente, dado que e son independientes, para todos , revelando la integral como meramente la expectativaIXYf(X,Y)(x,y)=fX(x)fY(y)(x,y)

=I(x+ya)f(X,Y)(x,y)dydx=E(I(X+Ya))=P(X+Ya),

como se desee.


De manera más general, incluso cuando uno o ambos de o no tienen una función de distribución, aún podemos obtenerXY

FX+Y(a)=EX(FY(aX))=EY(FX(aY))

directamente de las definiciones básicas, utilizando la expectativa de los indicadores para ir y venir entre probabilidades y expectativas y explotando el supuesto de independencia para dividir el cálculo en expectativas separadas con respecto a e :XY

P(X+Ya)=E(I(X+Ya))=EX(EY(I(X+Ya))=EX(PY(YaX))=EX(FY(aX)).

Esto incluye las fórmulas habituales para variables aleatorias discretas, por ejemplo, aunque en una forma ligeramente diferente de lo habitual (porque se establece en términos de los CDF en lugar de las funciones de probabilidad de masa).

Si tiene un teorema lo suficientemente fuerte sobre el intercambio de derivadas e integrales, puede diferenciar ambos lados con respecto a para obtener la densidad de un solo golpe,afX+Y

fX+Y(a)=ddaFX+Y(a)=EX(ddaFY(aX))=EX(fY(aX))=fX(x)fY(ax)dx.
whuber
fuente