Suposiciones de LASSO

18

En un escenario de regresión LASSO donde

y=Xβ+ϵ ,

y las estimaciones de LASSO están dadas por el siguiente problema de optimización

minβ||yXβ||+τ||β||1

¿Hay supuestos de distribución con respecto al ?ϵ

En un escenario OLS, uno esperaría que los sean independientes y normalmente distribuidos.ϵ

¿Tiene algún sentido analizar los residuos en una regresión LASSO?

Sé que la estimación LASSO puede obtenerse como el modo posterior bajo independientes de doble exponencial para . Pero no he encontrado ninguna "fase de comprobación de suposiciones" estándar.βj

Gracias por adelantado (:

deps_stats
fuente

Respuestas:

16

No soy un experto en LASSO, pero aquí está mi opinión.

Primero tenga en cuenta que OLS es bastante robusto a las violaciones de la independencia y la normalidad. Entonces, a juzgar por el Teorema 7 y la discusión anterior en el artículo Robust Regression and Lasso (por X. Huan, C. Caramanis y S. Mannor), supongo que en la regresión LASSO no estamos más interesados ​​en la distribución de , pero en la distribución conjunta de . El teorema se basa en el supuesto de que es una muestra, por lo que esto es comparable a los supuestos OLS habituales. Pero LASSO es menos restrictivo, no restringe que se genere a partir del modelo lineal.εyo(yyo,Xyo)(yyo,Xyo)yyo

En resumen, la respuesta a su primera pregunta es no. No hay supuestos de distribución en , todos los supuestos de distribución están en . Además, son más débiles, ya que en LASSO no se postula nada sobre la distribución condicional .ε(y,X)(yEl |X)

Dicho esto, la respuesta a la segunda pregunta es entonces también no. Dado que el no juega ningún papel, no tiene ningún sentido analizarlos de la misma manera que los analiza en OLS (pruebas de normalidad, heterocedasticidad, Durbin-Watson, etc.). Sin embargo, debe analizarlos en contexto qué tan bueno era el ajuste del modelo.ε

mpiktas
fuente