Acabo de leer un artículo en el que los autores llevaron a cabo una regresión múltiple con dos predictores. El valor global de r cuadrado fue de 0,65. Proporcionaron una tabla que dividía el r-cuadrado entre los dos predictores. La mesa se veía así:
rsquared beta df pvalue
whole model 0.65 NA 2, 9 0.008
predictor 1 0.38 1.01 1, 10 0.002
predictor 2 0.27 0.65 1, 10 0.030
En este modelo, que se ejecutó R
utilizando el mtcars
conjunto de datos, el valor de r cuadrado total es 0.76.
summary(lm(mpg ~ drat + wt, mtcars))
Call:
lm(formula = mpg ~ drat + wt, data = mtcars)
Residuals:
Min 1Q Median 3Q Max
-5.4159 -2.0452 0.0136 1.7704 6.7466
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 30.290 7.318 4.139 0.000274 ***
drat 1.442 1.459 0.989 0.330854
wt -4.783 0.797 -6.001 1.59e-06 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 3.047 on 29 degrees of freedom
Multiple R-squared: 0.7609, Adjusted R-squared: 0.7444
F-statistic: 46.14 on 2 and 29 DF, p-value: 9.761e-10
¿Cómo puedo dividir el valor r cuadrado entre las dos variables predictoras?
Respuestas:
Puede obtener las dos correlaciones separadas y cuadrarlas o ejecutar dos modelos separados y obtener el R ^ 2. Solo se resumirán si los predictores son ortogonales.
fuente
Además de la respuesta de John , es posible que desee obtener las correlaciones semi-parciales al cuadrado para cada predictor.
Si está buscando una función R, hay
spcor()
en elppcor
paquete.También puede considerar el tema más amplio de evaluar la importancia variable en la regresión múltiple (por ejemplo, vea esta página sobre el paquete relaimpo ).
fuente
Agregué la etiqueta de varianza-descomposición a su pregunta. Aquí está parte de su wiki wiki :
Un método común es agregar regresores al modelo uno por uno y registrar el aumento en medida que se agrega cada regresor. Dado que este valor depende de los regresores que ya están en el modelo, uno debe hacer esto para cada orden posible en la que los regresores puedan ingresar al modelo, y luego promediar los pedidos. Esto es factible para modelos pequeños, pero se vuelve computacionalmente prohibitivo para modelos grandes, ya que el número de órdenes posibles es p ! para p predictores.R2 p! p
Grömping (2007, The American Statistician ) ofrece una visión general e indicadores de la literatura en el contexto de la evaluación de importancia variable.
fuente
y ~ a + b
va a ser lo mismo quey ~ b + a
, ¿no? Y sí, necesitas calcular la diferencia entrey ~ a
yy ~ a + b
así comoy ~ b
yy ~ a + b
, pero en realidad no tienes que correry ~ b + a
, ¿verdad? Por lo tanto, solo tendría que ejecutar modelos de (que es viable para un p ligeramente superior). Por favor, corríjanme si me equivoco ..a
a
b
y~1
y~a
b
y~b
y~a+b