Sé que la regresión lineal puede pensarse como "la línea que está verticalmente más cercana a todos los puntos" :
Pero hay otra forma de verlo, visualizando el espacio de la columna, como "la proyección sobre el espacio atravesado por las columnas de la matriz de coeficientes" :
Mi pregunta es: en estas dos interpretaciones, ¿qué sucede cuando usamos la regresión lineal penalizada, como la regresión de cresta y LASSO ? ¿Qué pasa con la línea en la primera interpretación? ¿Y qué pasa con la proyección en la segunda interpretación?
ACTUALIZACIÓN: @JohnSmith en los comentarios mencionó el hecho de que la penalización se produce en el espacio de los coeficientes. ¿Hay alguna interpretación en este espacio también?
regression
intuition
geometry
Lucas Reis
fuente
fuente
Respuestas:
Perdón por mis habilidades de pintura, intentaré darte la siguiente intuición.
Hay un mínimo de esta función, en el medio de los círculos rojos. Y este mínimo nos da la solución no penalizada.
La penalización más grande, los contornos azules "más estrechos" que obtenemos, y luego las gráficas se encuentran en un punto más cercano a cero. Un revés: cuanto menor es la penalización, los contornos se expanden y la intersección de las parcelas azul y roja se acerca al centro del círculo rojo (solución no penalizada).
Espero que eso explique algo de intuición sobre cómo funciona la regresión penalizada en el espacio de parámetros.
fuente
La intuición que tengo es la siguiente: en el caso de mínimos cuadrados, la matriz del sombrero es una proyección ortogonal, por lo tanto, idempotente. En el caso penalizado, la matriz del sombrero ya no es idempotente. En realidad, aplicarlo infinitamente muchas veces reducirá los coeficientes al origen. Por otro lado, los coeficientes aún deben estar en el intervalo de los predictores, por lo que sigue siendo una proyección, aunque no ortogonal. La magnitud del factor de penalización y el tipo de norma controlan la distancia y la dirección de la contracción hacia el origen.
fuente