Sigo leyendo sobre instancias en las que centramos los datos (por ejemplo, con regularización o PCA) para eliminar la intercepción (como se menciona en esta pregunta ). Sé que es simple, pero me está costando entender esto intuitivamente. ¿Podría alguien proporcionarme la intuición o una referencia que pueda leer?
regression
pca
centering
Alec
fuente
fuente
Respuestas:
¿Pueden ayudarme estas imágenes?
Las 2 primeras imágenes son sobre regresión. Centrar los datos no altera la pendiente de la línea de regresión, pero hace que la intersección sea igual a 0.
Las siguientes imágenes son sobre PCA. PCA es un modelo regresivo sin intercepción . Por lo tanto, los componentes principales inevitablemente provienen del origen. Si olvida centrar sus datos, el primer componente principal puede perforar la nube no a lo largo de la dirección principal de la nube y será (para fines estadísticos) engañoso.1
fuente
PCA is maximizing variance
Esto no es generalmente cierto. PCA maximiza (por la primera PC) la suma de desviaciones al cuadrado del origen. Solo si los datos se centraron preliminarmente (centrarse en sí mismo no es parte de PCA), se convierte en una variación máxima.