Supongo que se siente cómodo con respecto al triángulo rectángulo en el sentido de que e Y - E [ Y ∣ X ] son variables aleatorias no correlacionadas . Para las variables aleatorias no correlacionadas A y B ,
var ( A + B ) = var ( A ) + var ( B ) ,
y así si establecemos A = Y - Y ∣E[Y∣X]Y−E[Y∣X]AB
var(A+B)=var(A)+var(B),(1)
y
B = E [ Y ∣ X ] para que
A + B = Y , obtengamos que
var ( Y ) = var ( Y - E [ Y ∣ X ] ) + var ( E [ Y ∣ X ] ) .
Queda por demostrar que
var ( Y - E [ Y ] ) es lo mismo que
A=Y−E[Y∣X]B=E[Y∣X]A+B=Yvar(Y)=var(Y−E[Y∣X])+var(E[Y∣X]).(2)
var(Y−E[Y∣X]) para que podamos volver a declarar
( 2 ) como
var ( Y ) = E [ var ( Y ∣ X ) ] + var ( E [ Y ∣ X ] )E[var(Y∣X)](2)var(Y)=E[var(Y∣X)]+var(E[Y∣X])(3)
cuál es la fórmula de varianza total.
Es bien sabido que el valor esperado de la variable aleatoria es E [ Y ] , es decir, E [ E [ Y ∣ X ] ] = E [ Y ] . Entonces vemos que
E [ A ] = E [ Y - E [ Y ∣ X ] ] = E [ Y ] - E [ Y ∣E[Y∣X]E[Y]E[E[Y∣X]]=E[Y]
de donde se deduce que var ( A ) = E [ A 2 ] , es decir,
var ( Y - E [ Y ∣ X ] ) = E [ ( Y - E [ Y ∣ X ] ) 2 ] .
Deje C denotar la variable aleatoria ( Y - E ∣ X ] )
E[A]=E[Y−E[Y∣X]]=E[Y]−E[E[Y∣X]]=0,
var(A)=E[A2]var(Y−E[Y∣X])=E[(Y−E[Y∣X])2].(4)
C para que podamos escribir que
var ( Y - E [ Y ∣ X ] ) = E [ C ] .
Pero,
E [ C ] = E [ E [ C ∣ X ] ] donde
E [ C ∣ X ] = E [ ( Y - E [ Y ∣ X ] )(Y−E[Y∣X])2var(Y−E[Y∣X])=E[C].(5)
E[C]=E[E[C∣X]]
Ahora,
dadoque
X = x , la distribución condicional de
Y tiene una media
E [ Y ∣ X = x ]
y entonces
E [ ( Y - E [ Y ∣ X = x ] ) 2 | X = x ] = var ( Y ∣ X = x ) .
En otras palabras,
EE[C∣X]=E[(Y−E[Y∣X])2∣∣X].X=xYE[Y∣X=x]E[(Y−E[Y∣X=x])2∣∣X=x]=var(Y∣X=x).
para que la
variable aleatoria E [ C ∣ X ] sea solo
var ( Y ∣ X ) . Por lo tanto,
E [ C ] = E [ E [ C ∣ X ] ] = E [ var ( Y ∣ X ) ] ,E[C∣X=x]=var(Y∣X=x) E[C∣X]var(Y∣X)E[C]=E[E[C∣X]]=E[var(Y∣X)],(6)
que tras la sustitución en
(5)muestra que
Esto hace que el lado derecho de
( 2 ) sea exactamente lo que necesitamos y, por lo tanto, hemos demostrado la fórmula de varianza total
( 3 ) .
var(Y−E[Y∣X])=E[var(Y∣X)].
(2)(3)
Declaración:
El teorema de Pitágoras dice, para cualquier elementoT1 y T2 de un espacio interno del producto con normas finitas tales que ⟨ T1, T2⟩ = 0 ,
Nuestro caso:
En nuestro casoT1= E( YEl | X) y T2= Y- E[ YEl | X] son variables aleatorias, la norma al cuadrado es El | El | TyoEl | El |2= E[ T2yo] y el producto interior ⟨ T1, T2⟩ = E[ T1T2] . Traductorio ( 1 ) en lenguaje estadístico nos da:
Subtract(E[Y])2 from both sides, making the left hand side Var[Y] ,
Noting on the right hand side thatE[{E(Y|X)}2]−(E[Y])2=Var(E[Y|X]) ,
Noting thatE[(Y−E[Y|X])2]=E[E{(Y−E[Y|X])2}|X]=E[Var(Y|X)] .
For details about these three bullet points see @DilipSarwate's post. He explains this all in much more detail than I do.
fuente