¿Derivación del cambio de variables de una función de densidad de probabilidad?

16

En el libro de reconocimiento de patrones y aprendizaje automático (fórmula 1.27), da

dondex=g(y),px(x)es el pdf que corresponde apy(y)

py(y)=px(x)|dxdy|=px(g(y))|g(y)|
x=g(y)px(x)py(y) con respecto al cambio de la variable.

Los libros dicen que es porque las observaciones que caen en el rango , para valores pequeños de δ x , se transformarán en el rango ( y , y + δ y ) .(x,x+δx)δx(y,y+δy)

¿Cómo se deriva esto formalmente?


Actualización de Dilip Sarwate

El resultado se mantiene solo si es una función estrictamente monótona de aumento o disminución.g


Algunas modificaciones menores a la respuesta de LV Rao Por lo tanto, si está aumentando monotónicamente

P(Yy)=P(g(X)y)={P(Xg1(y)),if g is monotonically increasingP(Xg1(y)),if g is monotonically decreasing
gf Y ( y ) = f X ( g - 1 ( y ) ) d
FY(y)=FX(g1(y))
si disminuye monotónicamente FY(y)=1-FX(g-1(y))fY(y)=-fX(g-1(y))d
fY(y)=fX(g1(y))ddyg1(y)
FY(y)=1FX(g1(y))
fY(y)=fX(g1(y))ddyg1(y)
fY(y)=fX(g1(y))|ddyg1(y)|
dontloo
fuente
1
gg
La explicación de su libro recuerda a la que ofrecí en stats.stackexchange.com/a/14490/919 . También publiqué un método algebraico general en stats.stackexchange.com/a/101298/919 y una explicación geométrica en stats.stackexchange.com/a/4223/919 .
whuber
1
@DilipSarwate gracias por su explicación, creo que entiendo la intuición, pero estoy más interesado en cómo se puede derivar utilizando las reglas y teoremas existentes :)
dontloo

Respuestas:

15

XpdfY=g(X)pdfY

P(Yy)=P(g(X)y)=P(Xg1(y))orFY(y)=FX(g1(y)),by the definition of CDF
yYY
fY(y)=fX(g1(y))ddyg1(y)
Y
fY(y)=fX(g1(y))ddyg1(y)
fY(y)=fX(g1(y))|ddyg1(y)|
LVRao
fuente
Pero como la integral sobre fx debe sumar 1 y fy es una versión escalada de fx, ¿no significa eso que fy no es un pdf adecuado, a menos que el jacobiano en el abs () sea 1 o -1?
Chris
sol-1no es necesariamente una función constante, por lo que puede ser> 1 en algunos lugares y <1 en otros.
Yatharth Agarwal