Probablemente estoy lidiando con un problema que probablemente se haya resuelto cientos de veces antes, pero no estoy seguro de dónde encontrar la respuesta.
Cuando mediante regresión logística, dadas muchas características tratando de predecir un valor categórico binario y , estoy interesado en seleccionar un subconjunto de las características que predice y bien.
¿Existe un procedimiento similar al lazo que se pueda usar? (Solo he visto el lazo utilizado para la regresión lineal).
¿Observar los coeficientes del modelo ajustado es indicativo de la importancia de las diferentes características?
Editar - Aclaraciones después de ver algunas de las respuestas:
Cuando me refiero a la magnitud de los coeficientes ajustados, me refiero a aquellos que están ajustados a características normalizadas (media 0 y varianza 1). De lo contrario, como señaló @probabilityislogic, 1000x parecería menos importante que x.
No me interesa simplemente encontrar el mejor k-subconjunto (como estaba ofreciendo @Davide), sino más bien sopesar la importancia de las diferentes características entre sí. Por ejemplo, una característica podría ser "edad" y la otra característica "edad> 30". Su importancia incremental puede ser pequeña, pero ambas pueden ser importantes.
fuente
La respuesta a su última pregunta es un NO rotundo. La magnitud de los coeficientes de ninguna manera es una medida de importancia. El lazo puede usarse para la regresión logística. Necesitas estudiar el área más asiduamente. Los métodos que necesita estudiar son aquellos que involucran métodos "penalizados". Si está buscando métodos de detección que descubran predictores "sombreados", un término que puede definirse en algún lugar pero no es de uso general, entonces debe buscar métodos que inspeccionen las interacciones y la estructura no lineal dentro del espacio del predictor y el enlace de resultado a ese espacio. Hay bastante discusión sobre estos temas y métodos en el texto de Frank Harrell "Estrategias de modelado de regresión".
La estrategia de selección hacia atrás no podrá entregar resultados válidos (aunque sí arroja resultados). Si observa un caso de 20 predictores aleatorios para 100 eventos, probablemente encontrará 2 o 3 que se seleccionarán con un proceso de selección hacia atrás. La prevalencia de la selección hacia atrás en el mundo real no refleja un pensamiento estadístico cuidadoso, sino más bien su fácil disponibilidad en SAS y SPSS y la falta de sofisticación de la base de usuarios de esos productos. La base de usuarios R tiene más dificultades para acceder a dichos métodos y los usuarios que publican solicitudes en las listas de correo y, por lo tanto, generalmente reciben asesoramiento sobre los problemas relacionados con los métodos de selección hacia atrás (o hacia adelante).
fuente
El inglés no es mi lengua materna, por lo que es posible que no haya entendido cuál es su problema, pero si necesita encontrar el mejor modelo, puede intentar usar un procedimiento hacia atrás (y eventualmente agregar interacciones), comenzando con un modelo con todas las covariables. Luego puede mirar los valores residuales_vs_predictados y los gráficos de qq-plot para verificar si el modelo describe bien su fenómeno
fuente