Soy muy consciente de los problemas de selección por pasos / adelante / atrás en los modelos de regresión. Existen numerosos casos de investigadores que denuncian los métodos y apuntan a mejores alternativas. Tenía curiosidad por saber si hay alguna historia donde exista un análisis estadístico:
- ha usado regresión por pasos;
- hizo algunas conclusiones importantes basadas en el modelo final
- la conclusión fue incorrecta, lo que resultó en consecuencias negativas para el individuo, su investigación o su organización
Pensé en esto si los métodos por pasos son malos, entonces debería haber consecuencias en el "mundo real" por usarlos.
regression
stepwise-regression
history
probabilidadislogica
fuente
fuente
Respuestas:
Se hace más de una pregunta. El más estrecho es pedir un ejemplo de cuándo la regresión gradual ha causado daño porque se realizó paso a paso. Por supuesto, esto es cierto, pero solo se puede establecer de manera inequívoca cuando los datos utilizados para la regresión gradual también se publican, y alguien los vuelve a analizar y publica una corrección revisada por pares con una retracción de los autores principales publicados. Hacer acusaciones en cualquier otro contexto conlleva el riesgo de una acción legal y, si utilizamos un conjunto de datos diferente, podríamos sospechar que se cometió un error, pero "las estadísticas nunca prueban nada" y no podríamos establecer que se cometió un error. hecho; "más allá de una duda razonable".
De hecho, con frecuencia se obtienen resultados diferentes dependiendo de si se hace una eliminación gradual o una acumulación gradual de una ecuación de regresión, lo que nos sugiere que ninguno de los enfoques es lo suficientemente correcto como para recomendar su uso. Claramente, algo más está sucediendo, y eso nos lleva a una pregunta más amplia, también formulada anteriormente, pero en forma de viñetas, que equivale a "¿Cuáles son los problemas con la regresión gradual, de todos modos? Esa es la pregunta más útil para responder y beneficio adicional de que no tendré una demanda judicial en mi contra por responderla.
Hacerlo bien para MLR paso a paso, significa usar 1) unidades físicamente correctas (ver más abajo), y 2) transformación de variable apropiada para mejores correlaciones y tipo de distribución de error (para homocedasticidad y fisicalidad), y 3) usar todas las permutaciones de combinaciones variables, no paso a paso, todos ellos , y 4) si uno realiza diagnósticos de regresión exhaustivos, evita evitar combinaciones variables de VIF (colinealidad) que de otra manera serían engañosas, entonces la recompensa es una mejor regresión.
Como se prometió para el n. ° 1 anterior, a continuación exploramos las unidades correctas para un sistema físico. Dado que los buenos resultados de la regresión dependen del tratamiento correcto de las variables, debemos tener en cuenta las dimensiones habituales de las unidades físicas y equilibrar nuestras ecuaciones adecuadamente. Además, para aplicaciones biológicas, se necesita una conciencia y una explicación de la dimensionalidad de la escala alométrica .
fuente