¿Cuál es la conexión entre la regularización y el método de multiplicadores de lagrange?

12

Para evitar el sobreajuste de las personas, las personas agregan un término de regularización (proporcional a la suma al cuadrado de los parámetros del modelo) con un parámetro de regularización a la función de costo de la regresión lineal. ¿Es este parámetro lo mismo que un multiplicador lagrange? Entonces, ¿es la regularización lo mismo que el método del multiplicador de lagrange? ¿O cómo están conectados estos métodos? λλ

asmaier
fuente

Respuestas:

11

Supongamos que estamos optimizando un modelo con parámetros , minimizando algún criterio sujeto a una restricción en la magnitud del vector de parámetros (por ejemplo, para implementar un enfoque de minimización de riesgos estructurales mediante construyendo un conjunto anidado de modelos de complejidad creciente), necesitaríamos resolver:θf(θ)

minθf(θ)s.t.θ2<C

El lagrangiano para este problema es (advertencia: creo que ha sido un día largo ... ;-)

Λ(θ,λ)=f(θ)+λθ2λC.

Por lo tanto, se puede ver fácilmente que una función de costo regularizado está estrechamente relacionada con un problema de optimización restringido con el parámetro de regularización relacionado con la constante que gobierna la restricción ( ), y es esencialmente el multiplicador de Lagrange. λC

Esto ilustra por qué, por ejemplo, la regresión de cresta implementa la minimización del riesgo estructural: la regularización es equivalente a poner una restricción en la magnitud del vector de peso y si entonces cada modelo que se puede hacer mientras se obedece la restricción queC1>C2

θ2<C2

también estará disponible bajo la restricción

θ2<C1 .

Por lo tanto, reducir genera una secuencia de espacios de hipótesis de complejidad creciente.λ

Dikran Marsupial
fuente