Tengo un modelo de regresión lineal con la muestra y las observaciones variables y quiero saber:
- Si una variable específica es lo suficientemente significativa como para permanecer incluida en el modelo.
- Si otra variable (con observaciones) debería incluirse en el modelo.
¿Qué estadísticas me pueden ayudar? ¿Cómo puede obtenerlos de manera más eficiente?
regression
Wilhelm
fuente
fuente
Secundo el comentario de Rob. Una alternativa cada vez más preferida es incluir todas sus variables y reducirlas a 0. Ver Tibshirani, R. (1996). Contracción de la regresión y selección a través del lazo.
http://www-stat.stanford.edu/~tibs/lasso/lasso.pdf
fuente
Para la parte 1, que está buscando la prueba F . Calcule su suma residual de cuadrados de cada ajuste del modelo y calcule una estadística F, que puede usar para encontrar valores p de una distribución F o alguna otra distribución nula que usted mismo genera.
fuente
Otro voto para la respuesta de Rob.
También hay algunas ideas interesantes en la literatura de "importancia relativa". Este trabajo desarrolla métodos que buscan determinar cuánta importancia se asocia con cada uno de varios predictores candidatos. Hay métodos bayesianos y frequentistas. Consulte el paquete "relaimpo" en R para obtener citas y código.
fuente
También me gusta la respuesta de Rob. Y, si utiliza SAS en lugar de R, puede usar PROC GLMSELECT para modelos que se harían con PROC GLM, aunque también funciona bien para algunos otros modelos. Ver
Flom y Cassell "Deteniéndose paso a paso: por qué los métodos de selección paso a paso son malos y qué debe usar" presentados en varios grupos, más recientemente, NESUG 2009
fuente