¿Cómo dividir r-cuadrado entre variables predictoras en regresión múltiple?

16

Acabo de leer un artículo en el que los autores llevaron a cabo una regresión múltiple con dos predictores. El valor global de r cuadrado fue de 0,65. Proporcionaron una tabla que dividía el r-cuadrado entre los dos predictores. La mesa se veía así:

            rsquared beta    df pvalue
whole model     0.65   NA  2, 9  0.008
predictor 1     0.38 1.01 1, 10  0.002
predictor 2     0.27 0.65 1, 10  0.030

En este modelo, que se ejecutó Rutilizando el mtcarsconjunto de datos, el valor de r cuadrado total es 0.76.

summary(lm(mpg ~ drat + wt, mtcars))

Call:
lm(formula = mpg ~ drat + wt, data = mtcars)

Residuals:
    Min      1Q  Median      3Q     Max 
-5.4159 -2.0452  0.0136  1.7704  6.7466 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept)   30.290      7.318   4.139 0.000274 ***
drat           1.442      1.459   0.989 0.330854    
wt            -4.783      0.797  -6.001 1.59e-06 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1

Residual standard error: 3.047 on 29 degrees of freedom
Multiple R-squared:  0.7609,    Adjusted R-squared:  0.7444 
F-statistic: 46.14 on 2 and 29 DF,  p-value: 9.761e-10

¿Cómo puedo dividir el valor r cuadrado entre las dos variables predictoras?

luciano
fuente
1
Esta publicación proporciona información sobre cómo particionar el . R2
COOLSerdash
8
Este comentario puede representar, breve e inadecuadamente, el punto de vista de que esto a menudo resultará inútil, si no peligroso. El éxito o el fracaso de un modelo se considera mejor como el resultado de un esfuerzo de equipo por parte de los predictores (y sus formas funcionales particulares, términos de interacción, etc., etc.) y debe juzgarse como tal. Naturalmente, la mayoría de nosotros estamos interesados ​​en la importancia relativa de los predictores y no es una tontería, pero los intentos de cuantificarlo exactamente deben ir acompañados de declaraciones completas de las limitaciones técnicas y filosóficas de dicho ejercicio.
Nick Cox

Respuestas:

5

Puede obtener las dos correlaciones separadas y cuadrarlas o ejecutar dos modelos separados y obtener el R ^ 2. Solo se resumirán si los predictores son ortogonales.

John
fuente
2
Por "ortogonal", ¿quiere decir que los dos predictores no deberían estar correlacionados entre sí?
luciano
3
Sí, sin correlación ... es la única forma en que suman el total.
John
12

Además de la respuesta de John , es posible que desee obtener las correlaciones semi-parciales al cuadrado para cada predictor.

  • Predictores no correlacionados : si los predictores son ortogonales (es decir, no correlacionados), las correlaciones semi-parciales al cuadrado serán las mismas que las correlaciones de orden cero al cuadrado.
  • Predictores correlacionados: si los predictores están correlacionados, entonces la correlación semi-parcial al cuadrado representará la varianza única explicada por un predictor dado. En este caso, la suma de las correlaciones semi-parciales al cuadrado será menor que . Esta varianza explicada restante representará la varianza explicada por más de una variable.R2

Si está buscando una función R, hay spcor()en el ppcorpaquete.

También puede considerar el tema más amplio de evaluar la importancia variable en la regresión múltiple (por ejemplo, vea esta página sobre el paquete relaimpo ).

Jeromy Anglim
fuente
3

Agregué la etiqueta de a su pregunta. Aquí está parte de su wiki wiki :

Un método común es agregar regresores al modelo uno por uno y registrar el aumento en medida que se agrega cada regresor. Dado que este valor depende de los regresores que ya están en el modelo, uno debe hacer esto para cada orden posible en la que los regresores puedan ingresar al modelo, y luego promediar los pedidos. Esto es factible para modelos pequeños, pero se vuelve computacionalmente prohibitivo para modelos grandes, ya que el número de órdenes posibles es p ! para p predictores.R2p!p

Grömping (2007, The American Statistician ) ofrece una visión general e indicadores de la literatura en el contexto de la evaluación de importancia variable.

S. Kolassa - Restablece a Monica
fuente
¿Importa realmente el orden? Quiero decir, y ~ a + bva a ser lo mismo que y ~ b + a, ¿no? Y sí, necesitas calcular la diferencia entre y ~ ay y ~ a + basí como y ~ by y ~ a + b, pero en realidad no tienes que correr y ~ b + a, ¿verdad? Por lo tanto, solo tendría que ejecutar modelos de (que es viable para un p ligeramente superior). Por favor, corríjanme si me equivoco ..2p
naught101
R2aabR2y~1y~abR2y~by~a+b
2p2!
2p=q=0p(pq)(pq)qpq=0qqq=1pq(pq)2p