La forma cerrada de w en regresión lineal se puede escribir como
¿Cómo podemos explicar intuitivamente el papel de en esta ecuación?
La forma cerrada de w en regresión lineal se puede escribir como
¿Cómo podemos explicar intuitivamente el papel de en esta ecuación?
Respuestas:
Encontré estas publicaciones particularmente útiles:
¿Cómo derivar el estimador de mínimos cuadrados para la regresión lineal múltiple?
Relación entre SVD y PCA. ¿Cómo usar SVD para realizar PCA?
http://www.math.miami.edu/~armstrong/210sp13/HW7notes.pdf
Si es una matriz entonces la matriz define una proyección sobre el espacio de la columna de . Intuitivamente, tiene un sistema de ecuaciones sobredeterminado, pero aún quiere usarlo para definir un mapa lineal que asignará las filas de a algo cercano a los valores , . Por lo tanto, nos conformamos con enviar a lo más cercano a que se puede expresar como una combinación lineal de sus características (las columnas de ). n × p X ( X T X ) - 1 X T X R p → R x i X y i i ∈ { 1 , … , n } X y XX n×p X(XTX)−1XT X Rp→R xi X yi i∈{1,…,n} X y X
En cuanto a una interpretación de , todavía no tengo una respuesta sorprendente. Sé que puedes pensar que es básicamente la matriz de covarianza del conjunto de datos. ( X T X )(XTX)−1 (XTX)
fuente
Punto de vista geométrico
Un punto de vista geométrico puede ser como la N-dimensional vectores y siendo puntos en n-dimensional espacio- . Donde también está en el subespacio abarcado por los vectores .X β V X β W x 1 , x 2 , ⋯ , x my Xβ V Xβ^ W x1,x2,⋯,xm
Dos tipos de coordenadas
Para este subespacio podemos imaginar dos tipos diferentes de coordenadas :W
Elα no son coordenadas en el sentido normal, pero lo hacen definir un punto en el subespacio . Cada relaciona con las proyecciones perpendiculares sobre los vectores . Si utilizamos los vectores unitarios (por simplicidad), las "coordenadas" para un vector se pueden expresar como:W αi xi xi αi z
y el conjunto de todas las coordenadas como:
Mapeo entre coordenadas yα β
para la expresión de "coordenadas" convierte en una conversión de coordenadas a "coordenadas"z=Xβ α β α
Podrías ver como expresión de cuánto se proyecta cada sobre el otro(XTX)ij xi xj
Entonces, la interpretación geométrica de puede verse como el mapa desde las "coordenadas" proyección vectorial a las coordenadas lineales .(XTX)−1 α β
La expresión da las "coordenadas" de proyección de y convierte en .XTy y (XTX)−1 β
Nota : las "coordenadas" de proyección de son las mismas que las "coordenadas" de proyección de desde .y y^ (y−y^)⊥X
fuente
Suponiendo que esté familiarizado con la regresión lineal simple: y su solución : β = c o v [ x i , y i ]
Es fácil ver cómo corresponde al numerador anterior y asigna al denominador. Como estamos tratando con matrices, el orden importa. es la matriz KxK, y es el vector Kx1. Por lo tanto, el orden es:X ′ X X ′ X X ′ y ( X ′ X ) - 1 X ′ yX′y X′X X′X X′y (X′X)−1X′y
fuente