En particular, me pregunto por qué tenemos este concepto R múltiple (que puedo entender como la correlación entre las puntuaciones observadas y pronosticadas en la regresión múltiple), y luego un concepto R-cuadrado separado que es solo el cuadrado o R.
Me han informado que R cuadrado es la variación porcentual explicada y R no, pero no entiendo la distinción que se hace entre correlación y variación explicada.
multiple-regression
user1205901 - Restablecer Monica
fuente
fuente
Respuestas:
Una cuestión principal aquí es que la medida de "variación" en el análisis de regresión está relacionada con las diferencias al cuadrado de las variables observadas de sus valores medios predichos. Esta es una elección útil de una medida de variación, tanto para el análisis teórico como para el trabajo práctico, porque las diferencias al cuadrado de la media están relacionadas con la varianza de una variable aleatoria, y la varianza de la suma de dos variables aleatorias independientes es simplemente el suma de sus variaciones individuales.
Me temo que nunca he entendido la utilidad de especificar el valor de la R múltiple en lugar de . A diferencia del coeficiente de correlación en una regresión univariante, que muestra tanto la dirección como la fuerza de la relación entre 2 variables, la especificación de la R múltiple no parece agregar mucho más allá de una posibilidad de confusión adicional.R2 r
fuente