Estoy investigando con regresión logística. 10 variables influyen en la variable dependiente. Uno de los mencionados es categórico (por ejemplo, entrega urgente, entrega estándar, etc.). Ahora quiero clasificar esas categorías en función de la "fuerza" de su efecto en la variable dependiente.
Todos son significativos (valor p pequeño), pero creo que no puedo usar el valor de las probabilidades para fines de clasificación. De alguna manera necesito averiguar si cada categoría también es significativamente diferente de las otras categorías. ¿Es esto correcto?
Leí sobre la posibilidad de centrar la variable. ¿Es esto realmente una opción? No quiero que el resto de mi modelo se vea afectado.
Salida de Stata para apoyar mi comentario en la publicación de @ subra:
Average marginal effects Number of obs = 124773
Model VCE : OIM
Expression : Pr(return), predict()
dy/dx w.r.t. : ExpDel
------------------------------------------------------------------------------
| Delta-method
| dy/dx Std. Err. z P>|z| [95% Conf. Interval]
-------------+----------------------------------------------------------------
ExpDel | .1054605 .0147972 7.36 0.000 .0798584 .1378626
------------------------------------------------------------------------------
Puede ajustar el modelo de regresión logística utilizando solo 1 variable a la vez y examinar el R2 ajustado.
El que explica la mayor parte de la variación debería tener más impacto en el modelo ...
Solo estoy adivinando, no estoy seguro de que sea una solución rigurosa ...
fuente
Esta es una pregunta común con una multitud de respuestas. Lo más simple es usar características estandarizadas; El valor absoluto de los coeficientes que regresan se puede interpretar libremente como 'más alto' = 'más influencia' en el registro (probabilidades). En su mayor parte, el uso de puntajes estándar no debería afectar sus resultados generales (la curva ROC debería ser la misma; la matriz de confusión debería ser la misma suponiendo que elija un umbral de decisión comparable). Usualmente calculo la regresión en ambos sentidos; una vez usando puntajes brutos (para obtener la ecuación de predicción que usaré) y una segunda vez usando puntajes estandarizados para ver cuáles son los más grandes.
En cuanto a los predictores categóricos, supongo (pero no he verificado) que lo mismo es cierto cuando se usan predictores normalizados.
Si aún no lo ha hecho, también debería considerar usar la regularización: Lazo / cresta / red elástica. Esto ayudará a que las funciones débiles, irrelevantes o redundantes se abandonen, dejándote con un modelo más parsimonioso.
fuente