Interpretación de predicciones simples a odds ratios en regresión logística

29

Soy algo nuevo en el uso de la regresión logística, y estoy un poco confundido por una discrepancia entre mis interpretaciones de los siguientes valores que pensé que sería lo mismo:

  • valores beta exponenciados
  • probabilidad pronosticada del resultado utilizando valores beta.

Aquí hay una versión simplificada del modelo que estoy usando, donde la desnutrición y el seguro son binarios, y la riqueza es continua:

Under.Nutrition ~ insurance + wealth

Mi modelo (real) devuelve un valor beta exponencial de .8 para el seguro, que interpretaría como:

"La probabilidad de estar desnutrido para un individuo asegurado es .8 veces la probabilidad de estar desnutrido para un individuo sin seguro".

Sin embargo, cuando calculo la diferencia en las probabilidades para los individuos al poner valores de 0 y 1 en la variable de seguro y el valor medio para la riqueza, la diferencia en desnutrición es solo de .04. Eso se calcula de la siguiente manera:

Probability Undernourished = exp(β0 + β1*Insurance + β2*Wealth) /
                             (1+exp(β0 + β1*Insurance + β2*wealth))

Realmente agradecería si alguien pudiera explicar por qué estos valores son diferentes, y qué mejor interpretación (particularmente para el segundo valor) podría ser.


Ediciones de aclaraciones adicionales
Según tengo entendido, la probabilidad de estar desnutrido para una persona sin seguro (donde B1 corresponde al seguro) es:

Prob(Unins) = exp(β0 + β1*0 + β2*Wealth) /
              (1+exp(β0 + β1*0+ β2*wealth))

Si bien la probabilidad de estar desnutrido para una persona asegurada es:

Prob(Ins)= exp(β0 + β1*1 + β2*Wealth) /
           (1+exp(β0 + β1*1+ β2*wealth))

Las probabilidades de estar desnutrido para una persona sin seguro en comparación con una persona asegurada son:

exp(B1)

¿Hay alguna manera de traducir entre estos valores (matemáticamente)? Todavía estoy un poco confundido por esta ecuación (donde probablemente debería ser un valor diferente en el RHS):

Prob(Ins) - Prob(Unins) != exp(B)

En términos simples, la pregunta es ¿por qué el aseguramiento de un individuo no cambia su probabilidad de estar desnutrido tanto como lo indica el odds ratio? En mis datos, Prob (Ins) - Prob (Unins) = .04, donde el valor beta exponencial es .8 (entonces, ¿por qué la diferencia no es .2?)

micro
fuente
2
¿Estas explicaciones maravillosas y claras son aplicables a los modelos / regresiones log-logísticos?

Respuestas:

50

exp(β0+β1x)exp(β0+β1x)1+exp(β0+β1x)
exp(β0+β1x)=0exp(β1)xx+1

Avíseme si necesita información adicional / diferente.

Actualización:
creo que esto es principalmente una cuestión de no estar familiarizado con las probabilidades y las probabilidades, y cómo se relacionan entre sí. Nada de eso es muy intuitivo, debe sentarse y trabajar con él durante un tiempo y aprender a pensar en esos términos; No es algo natural para nadie.

El problema es que los números absolutos son muy difíciles de interpretar solos. Digamos que te estaba contando sobre un momento en que tenía una moneda y me preguntaba si era justo. Así que volteé un poco y obtuve 6 cabezas. Qué significa eso? Es 6 mucho, un poco, ¿no? Es terriblemente difícil de decir. Para tratar este problema, queremos darles un poco de contexto. En un caso como este, hay dos opciones obvias sobre cómo proporcionar el contexto necesario: podría dar el número total de vueltas, o podría dar el número de colas. En cualquier caso, tiene información adecuada para dar sentido a 6 cabezas, y podría calcular el otro valor si el que le dije no era el que prefería. La probabilidad es el número de caras dividido por el número total de eventos. La probabilidad es la relación entre el número de caras y el número de

probability=odds1+odds                odds=probability1probability
exp(β)

[0,1](,+)(0,+)wealth

exp(β0+β1x)exp(β0+β1x)=exp(β0+β1x)1+exp(β0+β1x)exp(β0+β1x)1+exp(β0+β1x)
xx

(Aunque se escribió en el contexto de una pregunta diferente, mi respuesta aquí contiene mucha información sobre la regresión logística que puede ser útil para comprender mejor la LR y los problemas relacionados).

gung - Restablece a Monica
fuente
Gracias por la respuesta: expliqué aún más mi confusión en la edición anterior.
mike
Realmente aprecio tomarse el tiempo para escribir una explicación completa, muy útil.
Mike
De nada, @ Mike, para eso es CV.
gung - Restablece a Monica
Vuelva al enlace de probabilidades de Las Vegas : nunca he estado en Las Vegas, pero buscando algunos precios ofrecidos por los sitios con sede en Las Vegas, donde citan probabilidades fraccionales (en oposición a la línea de dinero), siguen el sistema británico de "probabilidades en contra". "probabilidades a favor" estadísticas. Como tal, las "probabilidades de Las Vegas" en su enlace no corresponden a las probabilidades reales de juego, donde "9 a 1" es para un evento improbable , no (como "9 a 1" significa para un estadístico) ¡probable! Una fuente de confusión que trato de abordar aquí
Silverfish
@Silverfish, no he estado en Las Vegas en mucho tiempo. No recuerdo si normalmente enumeran probabilidades a favor o en contra. Sin embargo, '4 a 5' se llama probabilidades de Las Vegas .
gung - Restablece a Monica
-1

La razón de probabilidades OR = Exp (b) se traduce en Probabilidad A = SQRT (OR) / (SQRT (OR) +1), donde la Probabilidad A es la probabilidad del Evento A y OR es la razón del evento A / evento no sucediendo A (o expuesto / no expuesto por el seguro como en la pregunta anterior). Me llevó bastante tiempo resolverlo; No estoy seguro de por qué esa fórmula no es tan conocida.

Hay un ejemplo Supongamos que hay 10 personas admitidas en la universidad; 7 de ellos son hombres. Entonces, para cada hombre es 70% de probabilidad de ser admitido. Las probabilidades de ser admitido para los hombres son 7/3 = 2,33 y no admitirse 3/7 = 0,43. La razón de probabilidades (OR) es 2,33 / 0,43 = 5,44, lo que significa que para los hombres 5,44 veces más posibilidades de ser admitido que para las mujeres. Encontremos la probabilidad de ser admitido para el hombre desde OR: P = SQRT (5.44) / (SQRT (5.44) +1) = 0.7

Actualización Esto es cierto solo si el número de hombres o mujeres admitidos es igual al número de solicitantes. En otras palabras, no es OR. No podemos encontrar que la ganancia (o pérdida) de probabilidad dependa del factor sin conocer información adicional.

Niksr
fuente
7232
Sí, tienes toda la razón, gracias. Descubrí que no podemos convertir el OR conocido (que obtenemos, por ejemplo, como salida de regresión logística) en probabilidades de ganancia o pérdida sin conocer información sobre probabilidades anteriores. Puse actualización en mi respuesta.
Niksr