La regresión gradual se había usado en exceso en muchos artículos biomédicos en el pasado, pero esto parece estar mejorando con una mejor educación de sus muchos problemas. Sin embargo, muchos críticos más antiguos todavía lo piden. ¿Cuáles son las circunstancias en las que la regresión gradual tiene un papel y debe usarse, si corresponde?
13
Respuestas:
No conozco situaciones en las que la regresión gradual sea el enfoque preferido. Puede estar bien (particularmente en su versión descendente a partir del modelo completo) con el arranque de todo el proceso paso a paso en conjuntos de datos extremadamente grandes con . Aquí es el número de observaciones en un resultado continuo (o el número de registros con un evento en el análisis de supervivencia) es el número de predictores candidatos, incluidas todas las interacciones consideradas, es decir, cuando cualquier efecto incluso pequeño se vuelve muy claro y no importa. tanto como construyes tu modelo (eso significaría que sería mucho más grande que que sustancialmente más que el factor a veces citado de 20).n>>p n p n p
Por supuesto, la razón por la que la mayoría de la gente está tentada a hacer algo como la regresión gradual es,
Es decir, un método como la regresión por pasos (si tuviera buenas características operativas) sería especialmente atractivo en esas situaciones, cuando no tiene buenas características operativas.
fuente
Dos casos en los que no me opondría a ver una regresión escalonada son
En estos dos casos de uso muy importantes, no está tan preocupado por la inferencia estadística tradicional, por lo que el hecho de que los valores p, etc., ya no sean válidos es de poca importancia.
Por ejemplo, si un trabajo de investigación decía "En nuestro estudio piloto, usamos la regresión gradual para encontrar 3 variables interesantes de 1000. En un estudio de seguimiento con nuevos datos, mostramos que estas 3 variables interesantes estaban fuertemente correlacionadas con el resultado de interés ", no tendría ningún problema con el uso de la regresión gradual. Del mismo modo, "Utilizamos la regresión por pasos para construir un modelo predictivo. Este modelo alternativo X preformado en nuestro conjunto de datos de retención con respecto a MSE" también está totalmente bien para mí.
Para ser claros, no estoy diciendo que la regresión escalonada sea la mejor manera de abordar estos problemas. Pero es fácil y puede brindarle soluciones satisfactorias.
EDITAR:
En los comentarios, hay una cuestión de si el AIC por pasos puede ser realmente útil para la predicción. Aquí hay una simulación que muestra que funciona mucho mejor que la regresión lineal con todas las covariables, y casi tan bien como las redes elásticas con la penalización elegida por validación cruzada.
No tomaría esta simulación como el final de la discusión; No es demasiado difícil llegar a un escenario en el que la AIC escalonada se empeore peor. ¡Pero en realidad no es un escenario irrazonable, y es exactamente el tipo de situación para la que están diseñadas las redes elásticas (alta correlación de covariables con muy pocos efectos grandes)!
Nota al margen:
Realmente no soy fanático de la regresión gradual por muchas, muchas razones, por lo que me siento un poco incómodo de haber tomado esta postura en defensa de ella. Pero simplemente creo que es importante ser preciso sobre exactamente lo que no me gusta.
fuente