Poder explicativo de una variable

8

Tengo un modelo de regresión lineal simple. Lo que quiero calcular es cuán "importante" es cada una de mis variables de entrada, es decir, hacer una declaración como esta:

"El 60% del poder predictivo en este modelo proviene de la variable var1, donde var2 y var3 tienen 30% y 10%" respectivamente "

¿Qué necesito hacer para calcular estos porcentajes?

usuario333
fuente
3
¿Qué quiere decir exactamente con "poder predictivo"? Por ejemplo, var3 puede tener una correlación extremadamente alta con la variable dependiente en una muestra, pero es posible que deba hacer predicciones donde var3 se desvía sustancialmente de los valores que alcanzó en la muestra, lo que introduce una gran incertidumbre de predicción. OTOH, var1 y var2 pueden tener correlaciones pobres con el DV individualmente, pero en conjunto pueden funcionar bien para las predicciones previstas. Esto indica que medir el "poder predictivo" requiere un contexto de predicción específico además del modelo.
whuber

Respuestas:

10

El paquete relaimpo R hace exactamente lo que desea hacer, y también proporciona CIs de arranque al evaluar la contribución relativa del predictor individual al .R2

Se puede encontrar un ejemplo de uso al final de este tutorial: Primeros pasos con un enfoque moderno de la regresión .

chl
fuente
+1 para una respuesta fácil a la pregunta formulada erróneamente. Debe agregar que esto solo funciona si el número de predictores es menor que, digamos, 50.
user603
@chl Los resultados (= orden de importancia de los regresores) de RelaImpo varían drásticamente de los resultados de los valores beta no estandarizados. Me pregunto por qué es así: todos mis 14 regresores tienen la misma métrica (rango 0-3), y aunque las medias y las desviaciones estándar varían drásticamente entre los síntomas, los pesos beta no estandarizados deberían dar resultados aproximadamente similares a los de RelaImpo, ¿o no? Gracias.
Torvon