Esta puede ser una pregunta básica, pero me preguntaba ¿por qué un valor en un modelo de regresión puede simplemente cuadrarse para dar una cifra de varianza explicada?
Entiendo que el coeficiente puede dar la fuerza de una relación, pero no entiendo cómo simplemente elevar al cuadrado este valor da una medida de la varianza explicada.
¿Alguna explicación fácil de esto?
Muchas gracias por ayudar con esto!
regression
correlation
r-squared
David
fuente
fuente
Respuestas:
Hand-wavingly, la correlación puede ser pensado como una medida del ángulo entre dos vectores, el vector dependiente y el vector independiente . Si el ángulo entre los vectores es , la correlación es . La parte de que se explica por es de longitud y es paralela a (o la proyección de en ). La parte que no se explica es de longitud y es ortogonal a . En términos de variaciones, tenemos Y X θ R cos ( θ ) Y X | El | Y | El | cos ( θ ) X Y X | El | Y | El | sin ( θ ) X σ 2 Y = σ 2 Y cos 2 ( θ ) + σ 2 Y sin 2 ( θ ) R 2 RR Y X θ R cos(θ) Y X ||Y||cos(θ) X Y X ||Y||sin(θ) X
fuente