¿Cuál es la complejidad asintótica del tiempo de la regresión Lasso a medida que crece el número de filas o columnas?
fuente
¿Cuál es la complejidad asintótica del tiempo de la regresión Lasso a medida que crece el número de filas o columnas?
Recuerde que el lazo es un modelo lineal con una regularización .
Encontrar los parámetros puede formularse como un problema de optimización sin restricciones, donde los parámetros están dados por
En la formulación restringida, los parámetros están dados por
Que es un problema de programación cuadrática y por lo tanto polinomial.
Casi todas las rutinas de optimización convexa, incluso para cosas no lineales flexibles como las redes neuronales, se basan en el cálculo de la derivada de sus parámetros de wrt objetivo. Sin embargo, no puede tomar la derivada de . Como tal, confías en diferentes técnicas. Existen muchos métodos para encontrar los parámetros. Aquí hay un artículo de revisión sobre el tema, Optimización de mínimos cuadrados con regularización de la norma L1 . La complejidad temporal de la optimización convexa iterativa es un poco difícil de analizar, ya que depende de un criterio de convergencia. En general, los problemas iterativos convergen en menos épocas a medida que aumentan las observaciones.
Si bien @JacobMick proporciona una visión general más amplia y un enlace a un documento de revisión, permítame darle una "respuesta de acceso directo" (que puede considerarse un caso especial de su respuesta).
Deje que el número de variables candidatas (características, columnas) sea y el tamaño de la muestra (número de observaciones, filas) sea n . Considere implementar LASSO usando el algoritmo LARS ( Efron et al., 2004 ). La complejidad computacional de LASSO es O ( K 3 + K 2 n ) ( ibid. )K n O(K3+K2n)
Referencias
fuente