He estado leyendo muchos documentos sobre ADMM últimamente, y también intenté resolver varios problemas al usarlo, en todos los cuales fue muy efectivo. A diferencia de otros métodos de optimización, no puedo tener una buena intuición de cómo y por qué este método es tan efectivo (por supuesto, he visto análisis de convergencia en algunos casos, pero nada que me haya dado mucha información). ¿Hay alguna intuición detrás de ADMM? ¿Cómo se les ocurrió esta idea a los primeros científicos en usarlo? Alguna intuición geométrica sería lo mejor, pero cualquier idea que alguien tenga ayudará.
optimization
admm
olamundo
fuente
fuente
Respuestas:
Si no recuerdo mal, el ADMM a menudo se establece como un algoritmo para resolver para dos convexos , inferior-semicontinuos funcionales y y lineales, operadores delimitadas y .F G A B
Encuentro el siguiente caso especial de , y ilustrativo. En este caso, la restricción dice , es decir, podemos sustituir para obtener el problema Ahora resolver esto puede ser difícil, mientras que resolver problemas de la forma puede ser fácil. (Puede crear ejemplos para esto usted mismo, uno popular es y ). En ADMM comienzas desde la "forma " y construyes el "lagragiano aumentado"A=I B=−I c=0 x - y= 0
El análisis de estos problemas de minimización de e más cerca, se observa que para cada actualización sólo se necesita para resolver un problema de la "forma más simple", por ejemplo, para la actualización (descuidando los términos que no dependen de ).y x x k + 1 = a r g m i n x F ( x ) + ρX y X x
ADMM para el problema se deriva de manera similar, pero los problemas intermedios para las actualizaciones siguen siendo una poco difícil pero puede ser comparativamente simple en comparación con el original. Especialmente en el caso de y (o equivalente , y la restricción ) las actualizaciones son más o menos fáciles de implementar.F ( x ) = λ ‖ x ‖ 1 G ( x ) = 1
fuente