¿Existe una fórmula de forma cerrada para (o algún tipo de límite en) el EMD entre y ?x 2 ∼ N ( μ 2 , Σ 2 )
26
¿Existe una fórmula de forma cerrada para (o algún tipo de límite en) el EMD entre y ?x 2 ∼ N ( μ 2 , Σ 2 )
Respuestas:
DejeX∼P=N(μx,Σx) , Y∼Q=N(μy,Σy) .
Un límite superior más apretado: considere el acoplamiento Este es el mapa derivado por Knott y Smith (1984) , Sobre el mapeo óptimo de distribuciones , Journal of Optimization Theory and Applications, 43 (1) pp 39-49 como el mapeo óptimo para ; Vea también esta publicación de blog . Tenga en cuenta que yXY∼N(μx,Σx)=μy+Σ−12x(Σ12xΣyΣ12x)12Σ−12xA(X−μx). W2 A=AT EYVarY=μy+A(EX−μx)=μy=AΣxAT=Σ−12x(Σ12xΣyΣ12x)12Σ−12xΣxΣ−12x(Σ12xΣyΣ12x)12Σ−12x=Σ−12x(Σ12xΣyΣ12x)Σ−12x=Σy,
para que el acoplamiento sea válido.
La distancia es entonces , donde ahora que es normal con∥X−Y∥ ∥D∥ D=X−Y=X−μy−A(X−μx)=(I−A)X−μy+Aμx, EDVarD=μx−μy=(I−A)Σx(I−A)T=Σx+AΣxA−AΣx−ΣxA=Σx+Σy−Σ−12x(Σ12xΣyΣ12x)12Σ12x−Σ12x(Σ12xΣyΣ12x)12Σ−12x.
Por lo tanto, un límite superior para es . Desafortunadamente, una forma cerrada para esta expectativa es sorprendentemente desagradable de escribir para las normales multivariadas generales: vea esta pregunta , así como esta .W1(P,Q) E∥D∥
Si la varianza de termina siendo esférica (por ejemplo, si , , entonces la varianza de convierte en ), la primera pregunta da la respuesta en términos de un polinomio de Laguerre generalizado.D Σx=σ2xI Σy=σ2yI D (σx−σy)2I
En general, tenemos un límite superior simple para basado en la desigualdad de Jensen, derivado, por ejemplo, en esa primera pregunta:E∥D∥ (E∥D∥)2≤E∥D∥2=∥μx−μy∥2+tr(Σx+Σy−AΣx−ΣxA)=∥μx−μy∥2+tr(Σx)+tr(Σy)−2tr(Σ−12x(Σ12xΣyΣ12x)12Σ12x)=∥μx−μy∥2+tr(Σx)+tr(Σy)−2tr((Σ12xΣyΣ12x)12)=W2(P,Q)2.
La igualdad al final se debe a que las matrices y son similares , por lo que tienen los mismos valores propios y, por lo tanto, sus raíces cuadradas tienen el mismo rastro.ΣxΣy Σ12xΣyΣ12x=Σ−12x(ΣxΣy)Σ12x
Esta desigualdad es estricta siempre que no sea degenerada, que es la mayoría de los casos cuando .∥D∥ Σx≠Σy
Una conjetura : Tal vez este límite superior más cercano, , es ajustado. Por otra parte, tuve un límite superior diferente aquí durante mucho tiempo que que era apretado, que de hecho era más flojo que el , por lo que tal vez no deberías confiar demasiado en esta conjetura. :)E∥D∥ W2
fuente