La regresión logística modela las probabilidades de registro de un evento como un conjunto de predictores. Es decir, log (p / (1-p)) donde p es la probabilidad de algún resultado. Por lo tanto, la interpretación de los coeficientes de regresión logística sin procesar para alguna variable (x) tiene que estar en la escala de probabilidades de registro. Es decir, si el coeficiente para x = 5, entonces sabemos que un cambio de 1 unidad en x corresponsales a un cambio de 5 unidades en la escala de probabilidad de registro de que se producirá un resultado.
Sin embargo, a menudo veo que las personas interpretan los coeficientes de regresión logística exponencial como odds ratios. Sin embargo, claramente exp (log (p / (1-p))) = p / (1-p), que es una probabilidad. Según tengo entendido, una razón de probabilidades es la probabilidad de que ocurra un evento (por ejemplo, p / (1-p) para el evento A) sobre las probabilidades de que ocurra otro evento (por ejemplo, p / (1-p) para el evento SI).
¿Que me estoy perdiendo aqui? Parece que esta interpretación común de los coeficientes de regresión logística exponencial es incorrecta.
fuente
Considere dos conjuntos de condiciones, la primera descrita por el vector de variables independientes , y la segunda descrita por el vector X ' , que difiere solo en la i-ésima variable x i , y por una unidad. Sea β el vector de los parámetros del modelo como de costumbre.X X′ Xyo β
Según el modelo de regresión logística, la probabilidad de que ocurra el evento en el primer caso es , de modo que las probabilidades de que ocurra el evento esp1pag1= 11 + exp( - Xβ) pag11 - p1= exp( Xβ)
fuente