Aulladores causados ​​por el uso de regresión gradual

20

Soy muy consciente de los problemas de selección por pasos / adelante / atrás en los modelos de regresión. Existen numerosos casos de investigadores que denuncian los métodos y apuntan a mejores alternativas. Tenía curiosidad por saber si hay alguna historia donde exista un análisis estadístico:

  • ha usado regresión por pasos;
  • hizo algunas conclusiones importantes basadas en el modelo final
  • la conclusión fue incorrecta, lo que resultó en consecuencias negativas para el individuo, su investigación o su organización

Pensé en esto si los métodos por pasos son malos, entonces debería haber consecuencias en el "mundo real" por usarlos.

probabilidadislogica
fuente
2
Si no encuentra tales historias, podría deberse a que la regresión gradual se usa principalmente en la investigación básica (o eso percibo). Los investigadores básicos no suelen meterse en problemas por estar equivocados, siempre y cuando no falsifiquen los datos o algo así.
Kodiólogo
3
Se usa mucho en la industria y en la sala de clase. En la investigación, los autores probablemente no revelarían que lo usaron. En la industria, las dos razones principales son que a) quienes lo están haciendo no estaban capacitados en investigación, por ejemplo, tienen títulos universitarios ob) se graduaron hace décadas.
Aksakal
@ Aksakal No aprender a comenzar, pero el problema es no tener piel de oveja, no el tiempo transcurrido. Exemplis gratis , yo. Tomé un curso de estadísticas alrededor de 1971, y utilicé estadísticas por primera vez en una publicación alrededor de 2006.
Carl

Respuestas:

1

Se hace más de una pregunta. El más estrecho es pedir un ejemplo de cuándo la regresión gradual ha causado daño porque se realizó paso a paso. Por supuesto, esto es cierto, pero solo se puede establecer de manera inequívoca cuando los datos utilizados para la regresión gradual también se publican, y alguien los vuelve a analizar y publica una corrección revisada por pares con una retracción de los autores principales publicados. Hacer acusaciones en cualquier otro contexto conlleva el riesgo de una acción legal y, si utilizamos un conjunto de datos diferente, podríamos sospechar que se cometió un error, pero "las estadísticas nunca prueban nada" y no podríamos establecer que se cometió un error. hecho; "más allá de una duda razonable".

De hecho, con frecuencia se obtienen resultados diferentes dependiendo de si se hace una eliminación gradual o una acumulación gradual de una ecuación de regresión, lo que nos sugiere que ninguno de los enfoques es lo suficientemente correcto como para recomendar su uso. Claramente, algo más está sucediendo, y eso nos lleva a una pregunta más amplia, también formulada anteriormente, pero en forma de viñetas, que equivale a "¿Cuáles son los problemas con la regresión gradual, de todos modos? Esa es la pregunta más útil para responder y beneficio adicional de que no tendré una demanda judicial en mi contra por responderla.

Hacerlo bien para MLR paso a paso, significa usar 1) unidades físicamente correctas (ver más abajo), y 2) transformación de variable apropiada para mejores correlaciones y tipo de distribución de error (para homocedasticidad y fisicalidad), y 3) usar todas las permutaciones de combinaciones variables, no paso a paso, todos ellos , y 4) si uno realiza diagnósticos de regresión exhaustivos, evita evitar combinaciones variables de VIF (colinealidad) que de otra manera serían engañosas, entonces la recompensa es una mejor regresión.

Como se prometió para el n. ° 1 anterior, a continuación exploramos las unidades correctas para un sistema físico. Dado que los buenos resultados de la regresión dependen del tratamiento correcto de las variables, debemos tener en cuenta las dimensiones habituales de las unidades físicas y equilibrar nuestras ecuaciones adecuadamente. Además, para aplicaciones biológicas, se necesita una conciencia y una explicación de la dimensionalidad de la escala alométrica .

solFR=kW1/ /4 4V2/ /3solFRW1=14 44 43+23solFR

Carl
fuente
2
Esto parece describir un problema con la regresión en general, en lugar de la regresión por pasos específicamente.
Estadístico accidental
2
Sí, estos son aspectos de regresión a considerar en general. Sin embargo, si entiendo correctamente de dónde proviene la pregunta, está motivada por una regresión gradual que a menudo se denuncia a favor de usar los gustos de LASSO, que no abordarían las preocupaciones que usted da aquí.
Estadístico accidental el
44
Aprecio tu franqueza y tu buena voluntad en este asunto, Carl. No negaré que votar tiene sus problemas. La única forma efectiva que conozco de cambiar la votación de una publicación es cambiar la respuesta, ya sea para mejorarla técnicamente, ampliarla o comunicar las ideas de manera diferente, e incluso entonces no hay garantía de que obtenga la respuesta deseada. (¡o incluso cualquier respuesta!). A veces, los esfuerzos respetuosos realizados para comprender a los votantes negativos generarán información que ayude a todos a apreciar (y votar) tales esfuerzos para mejorar una publicación.
whuber
3
@Carl Creo que si recibe votos negativos regularmente, lo primero que debe hacer es considerar cómo podría mejorar sus publicaciones (y a menudo tiene comentarios debajo de ellas que sugieren mejoras). Hablando por mí mismo, incluso cuando no estoy de acuerdo con un comentarista, resulta que a menudo plantean problemas que conducen a una mejor respuesta de todos modos. Diré que regularmente noto problemas con sus respuestas que casi me llevarían a rechazarlo yo mismo. Cuando tengo tiempo para hacerlo, trato de dejar un comentario.
Glen_b -Reinstale a Monica el
3
Tenga en cuenta que muchos de los problemas de regresión por pasos, como problemas con estimaciones sesgadas desde 0, errores estándar sesgados hacia 0, tasas de error tipo I nominales mucho más bajas que las reales y una variedad de otros problemas todavía están presentes con todos los subconjuntos. De hecho, es un problema con casi cualquier forma de optimización (el capítulo 4 de las estrategias de modelado de regresión de Frank Harrell es una referencia útil). La contracción / regularización puede mitigar algunos de estos problemas (especialmente la tendencia de la selección a sesgar las estimaciones hacia afuera) y la evaluación fuera de muestra es una herramienta importante para muchos de ellos.
Glen_b -Reinstala a Monica el