Tengo esta confusión sobre la regla de Armijo utilizada en la búsqueda de línea. Estaba leyendo la búsqueda de la línea de seguimiento, pero no entendí de qué se trata esta regla de Armijo. ¿Alguien puede explicar qué es la regla Armijo? La wikipedia no parece explicar bien. Gracias
optimization
usuario34790
fuente
fuente
Respuestas:
Una vez que obtenga una dirección de descenso para su función objetivo f ( x ) , debe elegir una longitud de paso "buena". No desea dar un paso que sea demasiado grande para que la función en su nuevo punto sea más grande que su punto actual. Al mismo tiempo, no desea hacer que su paso sea demasiado pequeño, de modo que se necesite una eternidad para converger.p f(x)
La condición de Armijo básicamente sugiere que una longitud de paso "buena" es tal que tiene una "disminución suficiente" en en su nuevo punto. La condición se establece matemáticamente como f ( x k + α p k ) ≤ f ( x k ) + β α ∇ f ( x k ) T p k donde p k es una dirección de descenso en x k y β ∈ ( 0 , 1 ) .f
La intuición detrás de esto es que el valor de la función en el nuevo punto debe estar debajo de la "línea tangente" reducida en x k en la dirección de p k . Ver el libro de Nocedal & Wright "Optimización numérica". En el capítulo 3, hay una excelente descripción gráfica de la condición de disminución suficiente de armijo.f(xk+αpk) xk pk
fuente
Cinco años después, esta pregunta sigue siendo válida.
Aquí (páginas 16 y 17) puede encontrar una gran explicación, incluido un algoritmo.
fuente