Interpretación de predictores transformados logarítmicos en regresión logística

15

Uno de los predictores en mi modelo logístico ha sido transformado logarítmicamente. ¿Cómo interpreta el coeficiente estimado del predictor transformado logarítmico y cómo calcula el impacto de ese predictor en la razón de probabilidades?


fuente
1
Un tratamiento muy claro e integral de esta pregunta es la respuesta de jthetzel
rolando2
Gracias por toda tu ayuda. Una aclaración adicional. En realidad, si me transformo en la base de registro 2, entonces, según la respuesta anterior, tiene sentido intuitivo que una duplicación en el predictor da como resultado un cambio del% del hacha en el resultado.
mp77

Respuestas:

16

Si expones el coeficiente estimado, obtendrás un odds ratio asociado con un aumento de vecesb en el predictor, donde es la base del logaritmo que usaste al transformar el predictor.b

Por lo general, elijo tomar logaritmos a la base 2 en esta situación, por lo que puedo interpretar el coeficiente exponencial como una razón de probabilidad asociada con una duplicación del predictor.

una parada
fuente
3
Interesante. I siempre utilizar los registros naturales porque muchos de los coeficientes tienden a estar cerca de cero y luego se puede interpretar como diferencias proporcionales (relativas). Eso no es posible en ninguna otra base de logaritmo. Veo algunos méritos en el uso de otras bases, pero creo que necesita aclarar su respuesta, porque prima facie su interpretación no utiliza el valor del coeficiente en absoluto.
whuber
@whuber lo siento, ¿qué significa prima facie ? Primera cara ??
onestop
8

@gung es completamente correcto, pero, en caso de que no decide mantenerla, puede interpretar el coeficiente ha tener un efecto en cada múltiple de la IV, en lugar de cada uno , además de la IV.

Un IV que a menudo debería transformarse es el ingreso. Si lo incluyó sin transformar, entonces cada (digamos) un aumento de $ 1,000 en ingresos tendría un efecto en la razón de probabilidades según lo especificado por la razón de probabilidades. Por otro lado, si tomó un registro (10) de ingresos, entonces cada aumento de 10 veces en los ingresos tendría el efecto en la razón de probabilidades especificada en la razón de probabilidades.

Tiene sentido hacer esto por ingresos porque, de muchas maneras, un aumento de $ 1,000 en ingresos es mucho mayor para alguien que gana $ 10,000 por año que para alguien que gana $ 100,000.

Una nota final: aunque la regresión logística no hace suposiciones de normalidad, incluso la regresión OLS no hace suposiciones sobre las variables, hace suposiciones sobre el error, según lo estimado por los residuos.

Peter Flom - Restablece a Monica
fuente
1
+1, buenos puntos. Supongo que podría haber sido más completo. Además, apagué el inadvertido mathjax poniendo una barra invertida "\" inmediatamente antes de los signos de dólar. Espero que no te moleste.
gung - Restablece a Monica
¿Qué quiere decir con 'la regresión logística supone suponer los errores'?
No, la regresión de OLS hace suposiciones sobre los errores. Eso es lo que dije.
Peter Flom - Restablece a Monica
3

Esta respuesta está adaptada de The Statistical Sleuth por Fred L. Ramsey y Daniel W. Schafer.

Si su ecuación modelo es:

log(p/(1p))=β0+βlog(X)

Entonces, cada aumento de veces en X se asocia con un cambio en las probabilidades por un factor multiplicativo de k β .kXkβ

Por ejemplo, tengo el siguiente modelo para la presencia de llagas en la cama en función de la duración de la estadía en un hospital.

log(oddsofbedsore)=.44+0.45(lengthofstay)

β=0.45

k

k=2

kβ=20.45=1.37

k=2

k=0.5

kβ=0.50.45=0.73

k=0.5

LindsayL
fuente