Soy algo nuevo en el uso de la regresión logística, y estoy un poco confundido por una discrepancia entre mis interpretaciones de los siguientes valores que pensé que sería lo mismo:
- valores beta exponenciados
- probabilidad pronosticada del resultado utilizando valores beta.
Aquí hay una versión simplificada del modelo que estoy usando, donde la desnutrición y el seguro son binarios, y la riqueza es continua:
Under.Nutrition ~ insurance + wealth
Mi modelo (real) devuelve un valor beta exponencial de .8 para el seguro, que interpretaría como:
"La probabilidad de estar desnutrido para un individuo asegurado es .8 veces la probabilidad de estar desnutrido para un individuo sin seguro".
Sin embargo, cuando calculo la diferencia en las probabilidades para los individuos al poner valores de 0 y 1 en la variable de seguro y el valor medio para la riqueza, la diferencia en desnutrición es solo de .04. Eso se calcula de la siguiente manera:
Probability Undernourished = exp(β0 + β1*Insurance + β2*Wealth) /
(1+exp(β0 + β1*Insurance + β2*wealth))
Realmente agradecería si alguien pudiera explicar por qué estos valores son diferentes, y qué mejor interpretación (particularmente para el segundo valor) podría ser.
Ediciones de aclaraciones adicionales
Según tengo entendido, la probabilidad de estar desnutrido para una persona sin seguro (donde B1 corresponde al seguro) es:
Prob(Unins) = exp(β0 + β1*0 + β2*Wealth) /
(1+exp(β0 + β1*0+ β2*wealth))
Si bien la probabilidad de estar desnutrido para una persona asegurada es:
Prob(Ins)= exp(β0 + β1*1 + β2*Wealth) /
(1+exp(β0 + β1*1+ β2*wealth))
Las probabilidades de estar desnutrido para una persona sin seguro en comparación con una persona asegurada son:
exp(B1)
¿Hay alguna manera de traducir entre estos valores (matemáticamente)? Todavía estoy un poco confundido por esta ecuación (donde probablemente debería ser un valor diferente en el RHS):
Prob(Ins) - Prob(Unins) != exp(B)
En términos simples, la pregunta es ¿por qué el aseguramiento de un individuo no cambia su probabilidad de estar desnutrido tanto como lo indica el odds ratio? En mis datos, Prob (Ins) - Prob (Unins) = .04, donde el valor beta exponencial es .8 (entonces, ¿por qué la diferencia no es .2?)
Respuestas:
Avíseme si necesita información adicional / diferente.
Actualización:
creo que esto es principalmente una cuestión de no estar familiarizado con las probabilidades y las probabilidades, y cómo se relacionan entre sí. Nada de eso es muy intuitivo, debe sentarse y trabajar con él durante un tiempo y aprender a pensar en esos términos; No es algo natural para nadie.
El problema es que los números absolutos son muy difíciles de interpretar solos. Digamos que te estaba contando sobre un momento en que tenía una moneda y me preguntaba si era justo. Así que volteé un poco y obtuve 6 cabezas. Qué significa eso? Es 6 mucho, un poco, ¿no? Es terriblemente difícil de decir. Para tratar este problema, queremos darles un poco de contexto. En un caso como este, hay dos opciones obvias sobre cómo proporcionar el contexto necesario: podría dar el número total de vueltas, o podría dar el número de colas. En cualquier caso, tiene información adecuada para dar sentido a 6 cabezas, y podría calcular el otro valor si el que le dije no era el que prefería. La probabilidad es el número de caras dividido por el número total de eventos. La probabilidad es la relación entre el número de caras y el número de
wealth
(Aunque se escribió en el contexto de una pregunta diferente, mi respuesta aquí contiene mucha información sobre la regresión logística que puede ser útil para comprender mejor la LR y los problemas relacionados).
fuente
Bueno, la respuesta es simple cuando está dispuesto a mantener todas las variables constantes y variar una variable. Sin embargo, se vuelve un poco complicado en el momento en que varía cada variable. Puede consultar la siguiente publicación, puede ayudar http://analyticspro.org/2016/03/02/r-tutorial-multiple-linear-regression/
fuente
La razón de probabilidades OR = Exp (b) se traduce en Probabilidad A = SQRT (OR) / (SQRT (OR) +1), donde la Probabilidad A es la probabilidad del Evento A y OR es la razón del evento A / evento no sucediendo A (o expuesto / no expuesto por el seguro como en la pregunta anterior). Me llevó bastante tiempo resolverlo; No estoy seguro de por qué esa fórmula no es tan conocida.
Hay un ejemplo Supongamos que hay 10 personas admitidas en la universidad; 7 de ellos son hombres. Entonces, para cada hombre es 70% de probabilidad de ser admitido. Las probabilidades de ser admitido para los hombres son 7/3 = 2,33 y no admitirse 3/7 = 0,43. La razón de probabilidades (OR) es 2,33 / 0,43 = 5,44, lo que significa que para los hombres 5,44 veces más posibilidades de ser admitido que para las mujeres. Encontremos la probabilidad de ser admitido para el hombre desde OR: P = SQRT (5.44) / (SQRT (5.44) +1) = 0.7
Actualización Esto es cierto solo si el número de hombres o mujeres admitidos es igual al número de solicitantes. En otras palabras, no es OR. No podemos encontrar que la ganancia (o pérdida) de probabilidad dependa del factor sin conocer información adicional.
fuente