El paso marcado es válido porque (a) y q tienen los mismos momentos cero y segundo y (b) log ( p ) es una función polinómica de los componentes de x cuyos términos tienen grados totales 0 o 2 .pqlog(p)x02
Solo necesita saber dos cosas acerca de una distribución normal multivariada con media cero:
es una función cuadrática de x = ( x 1 , x 2 , ... , x n ) sin términos lineales. Específicamente, hay constantes C y p i j para las cuales log ( p ( x ) ) = C + n ∑ i , j = 1 p i jlog(p)x=(x1,x2,…,xn) Cpij
Iniciar sesión( p ( x ) ) = C+ ∑i , j = 1nortepagyo jXyoXj.
(Por supuesto, y p i j pueden escribirse en términos de Σ , pero este detalle no importa).Cpagyo jΣ
da los segundos momentos de la distribución. Es decir, Σ i j = E p ( x i x j ) = ∫ p ( x )Σ
Σyo j= Epag( xyoXj) = ∫p ( x )XyoXjrex .
Podemos usar esta información para elaborar una integral:
=∫( q( x ) - p ( x ) ) log( p ( x ) ) dX∫( q( x ) - p ( x ) ) ( C+ ∑i , j = 1nortepagyo jXyoXj) dx .
Se divide en la suma de dos partes:
∫( q( x ) - p ( x ) ) Crex =C( ∫q(x)dx−∫p(x)dx)=C(1−1)=0qp
∫(q(x)−p(x))∑ni,j=1pijxixjdx=∑ni,j=1pij∫(q(x)−p(x))xixjdx=0 because each of the integrals on the right hand side, ∫q(x)xixjdx and ∫p(x)xixjdx, has the same value (to wit, Σij) Esto es lo que pretende decir la observación "producir los mismos momentos de la forma cuadrática".
El resultado sigue inmediatamente: desde ∫( q( x ) - p ( x ) ) log( p ( x ) ) dx =0, concluimos que ∫q( x ) registro( p ( x ) ) dx =∫p ( x ) log( p ( x ) ) dx .