¿Por qué los coeficientes de regresión logística exponencial se consideran "odds ratios"?

10

La regresión logística modela las probabilidades de registro de un evento como un conjunto de predictores. Es decir, log (p / (1-p)) donde p es la probabilidad de algún resultado. Por lo tanto, la interpretación de los coeficientes de regresión logística sin procesar para alguna variable (x) tiene que estar en la escala de probabilidades de registro. Es decir, si el coeficiente para x = 5, entonces sabemos que un cambio de 1 unidad en x corresponsales a un cambio de 5 unidades en la escala de probabilidad de registro de que se producirá un resultado.

Sin embargo, a menudo veo que las personas interpretan los coeficientes de regresión logística exponencial como odds ratios. Sin embargo, claramente exp (log (p / (1-p))) = p / (1-p), que es una probabilidad. Según tengo entendido, una razón de probabilidades es la probabilidad de que ocurra un evento (por ejemplo, p / (1-p) para el evento A) sobre las probabilidades de que ocurra otro evento (por ejemplo, p / (1-p) para el evento SI).

¿Que me estoy perdiendo aqui? Parece que esta interpretación común de los coeficientes de regresión logística exponencial es incorrecta.

Jack
fuente

Respuestas:

10

La respuesta de @ Laconic es genial y completa, en mi opinión. Algo que quería agregar es que los coeficientes originales describen una diferencia en las probabilidades de registro para dos unidades que difieren en 1 en el predictor. Por ejemplo, para un coeficiente en de 5, podemos decir que la diferencia en las probabilidades de registro entre dos unidades que difieren en X en 1 es 5. Matemáticamente,XX

β=log(odds(p|X=x0+1))log(odds(p|X=x0))

Cuando expones , obtienesβ

Exp(β)=Exp(Iniciar sesión(posibilidades(pagEl |X=X0 0+1))-Iniciar sesión(posibilidades(pagEl |X=X0 0)))=Exp(Iniciar sesión(posibilidades(pagEl |X=X0 0+1)))Exp(Iniciar sesión(posibilidades((pagEl |X=X0 0)))=posibilidades(pagEl |X=X0 0+1)posibilidades(pagEl |X=X0 0))

que es una razón de probabilidades, una razón de probabilidades.

Noé
fuente
2
Esto es extremadamente claro para mí. Mi pregunta está resuelta.
Jack
10

Considere dos conjuntos de condiciones, la primera descrita por el vector de variables independientes , y la segunda descrita por el vector X ' , que difiere solo en la i-ésima variable x i , y por una unidad. Sea β el vector de los parámetros del modelo como de costumbre.XXXyoβ

Según el modelo de regresión logística, la probabilidad de que ocurra el evento en el primer caso es , de modo que las probabilidades de que ocurra el evento esp1pag1=11+Exp(-Xβ)pag11-pag1=Exp(Xβ)

pag2=11+Exp(-Xβ)pag21-pag2=Exp(Xβ)=Exp(Xβ+βyo)

Exp(βyo)

El lacónico
fuente