¿Cuál es la complejidad temporal de la regresión de lazo?

14

¿Cuál es la complejidad asintótica del tiempo de la regresión Lasso a medida que crece el número de filas o columnas?

usuario2763361
fuente

Respuestas:

4

Recuerde que el lazo es un modelo lineal con una regularización l1 .

Encontrar los parámetros puede formularse como un problema de optimización sin restricciones, donde los parámetros están dados por

argminβ||yXβ||2+α||β||1

En la formulación restringida, los parámetros están dados por

argminβ||yXβ||2s.t.||β||1<α

Que es un problema de programación cuadrática y por lo tanto polinomial.

Casi todas las rutinas de optimización convexa, incluso para cosas no lineales flexibles como las redes neuronales, se basan en el cálculo de la derivada de sus parámetros de wrt objetivo. Sin embargo, no puede tomar la derivada de . Como tal, confías en diferentes técnicas. Existen muchos métodos para encontrar los parámetros. Aquí hay un artículo de revisión sobre el tema, Optimización de mínimos cuadrados con regularización de la norma L1 . La complejidad temporal de la optimización convexa iterativa es un poco difícil de analizar, ya que depende de un criterio de convergencia. En general, los problemas iterativos convergen en menos épocas a medida que aumentan las observaciones.α||w||1

Jessica Collins
fuente
44
Varias cosas: decir que un problema es "polinomial" no es particularmente útil, a menos que tal vez esté viendo algún tipo de problema combinatorio (que generalmente es exponencial). En segundo lugar, calcular las derivadas no siempre es el paso limitante. En tercer lugar, generalmente cuando se analiza la complejidad temporal de un algoritmo iterativo, normalmente se observa el costo por paso y, por lo tanto, no depende de los criterios de convergencia. Finalmente, no suele ser el caso que más observaciones = menos iteraciones.
Cliff AB
13

Si bien @JacobMick proporciona una visión general más amplia y un enlace a un documento de revisión, permítame darle una "respuesta de acceso directo" (que puede considerarse un caso especial de su respuesta).

Deje que el número de variables candidatas (características, columnas) sea y el tamaño de la muestra (número de observaciones, filas) sea n . Considere implementar LASSO usando el algoritmo LARS ( Efron et al., 2004 ). La complejidad computacional de LASSO es O ( K 3 + K 2 n ) ( ibid. )KnO(K3+K2n)

  • Para , K 3 < K 2 n y la complejidad computacional de LASSO es O ( K 2 n ) , que es la misma que la de una regresión con variables K ( Efron et al., 2004 , p. 443-444 ; también citado en Schmidt, 2005 , sección 2.4; para la complejidad computacional de una regresión, ver esta publicación ).K<nK3<K2nO(K2n)K
  • Para , y la complejidad computacional de LASSO es ( Efron et al., 2004 ).KnK3K2nO(K3)

Referencias

Richard Hardy
fuente
Richard, ¿puedes comentar sobre la complejidad de iteración para el enfoque GLM aquí stats.stackexchange.com/questions/280304/… ?
rnoodle
@moodle, no puedo sin profundizar en eso (para lo que no tengo tiempo en este momento), pero +1 para su pregunta.
Richard Hardy
Eché un vistazo, pero no está claro: sería bueno tener un segundo par de ojos en él. Por lo tanto, hay complejidad de iteración y complejidad de convergencia total, y creo que la literatura es algo vaga a veces sobre las definiciones. Básicamente tengo un algoritmo que usa un solucionador de lazo en una posición muy crítica, de modo que la complejidad de mi algoritmo depende en gran medida del solucionador. Sería bueno clavar esto. ¡Salud! Le daré una recompensa por su aporte
rnoodle
@rnoodle, dudo mucho que pueda ayudarte allí pronto, pero una recompensa ciertamente puede atraer a otras personas que conocen mejor. ¡Buena suerte!
Richard Hardy