¿Cuál es el valor p crítico utilizado por la step()
función en R para la regresión por pasos? Supongo que es 0.15, pero ¿es correcta mi suposición? ¿Cómo puedo cambiar el valor p crítico?
r
regression
p-value
stepwise-regression
Jason Samuels
fuente
fuente
Description
parte de la página de ayuda?step
dice, en su totalidad: Seleccione un modelo basado en fórmulas de AIC.Respuestas:
Como expliqué en mi comentario sobre su otra pregunta,
step
usa AIC en lugar de valores p.Sin embargo, para una sola variable a la vez, AIC hace corresponden al uso de un valor de p de 0,15 (o para ser más precisos, 0,1573):
Considere comparar dos modelos, que difieren en una sola variable. Llame a los modelos (modelo más pequeño) y M 1 (modelo más grande), y deje que sus AIC sean AIC 0 y AIC 1 respectivamente.METRO0 0 METRO1 AIC0 0 AIC1
Usando el criterio AIC, usaría el modelo más grande si . Este será el caso si - 2 log L 0 - ( - 2 log L 1 ) > 2 .AIC1< AIC0 0 - 2 logL0 0- ( - 2 logL1) > 2
Pero esta es simplemente la estadística en una prueba de razón de probabilidad. Del teorema de Wilks, rechazaremos el nulo si el estadístico excede el cuantil superior de a χ 2 1 . Entonces, si usamos una prueba de hipótesis para elegir entre el modelo más pequeño y el más grande, elegimos el modelo más grande cuando - 2 log L 0 - ( - 2 log L 1 ) > C α .α χ21 - 2 logL0 0- ( - 2 logL1) > Cα
Ahora encuentra en el percentil 84.27 de un χ 2 1 . Por lo tanto, si elegimos el modelo más grande cuando tiene un AIC más pequeño, esto corresponde a rechazar la hipótesis nula para una prueba del término adicional con un valor p de 1 - 0.843 = 0.157 , o 15.7 %2 χ21 1 - 0.843 = 0.157 15,7 %
Entonces, ¿cómo lo modificas?
Fácil. Cambie el
k
parámetrostep
de 2 a otra cosa. ¿Quieres un 10% en su lugar? Hazlo 2.7:¿Quieres un 2,5%? Conjunto
k=5
:y así.
Sin embargo, a pesar de que eso resuelve su pregunta, le aconsejo que preste mucha atención a la respuesta de Frank Harrell sobre su otra pregunta, y que busque respuestas de muchos estadísticos sobre otras preguntas relacionadas con la regresión gradual aquí, qué consejo tiende a ser muy consistentemente para evitar procedimientos escalonados en general.
fuente
Como se dijo anteriormente, la
step
función en R se basa en criterios AIC. Pero supongo que por valor p quieres decir alfa para entrar y alfa para salir. Lo que puede hacer es usar la funciónstepwise
escrita por Paul Rubin y disponible aquí . Como puede ver, tiene los argumentos de alpha.to.enter y alpha.to.leave que puede cambiar. Tenga en cuenta que esta función utiliza la prueba F o una prueba t equivalente para seleccionar los modelos. Además, puede manejar no solo la regresión por pasos, sino también la selección hacia adelante y la eliminación hacia atrás, si define correctamente los argumentos.fuente