Regresión logística y variables independientes ordinales.

10

He encontrado esta publicación:

Si. El coeficiente refleja el cambio en las probabilidades de registro para cada incremento de cambio en el predictor ordinal. Esta especificación de modelo (muy común) supone que el predictor tiene un impacto lineal en sus incrementos. Para probar el supuesto, puede comparar un modelo en el que usa la variable ordinal como un predictor único con uno en el que discretiza las respuestas y las trata como predictores múltiples (como lo haría si la variable fuera nominal); Si el último modelo no resulta en un ajuste significativamente mejor, entonces es razonable tratar cada incremento como si tuviera un efecto lineal.

- @ dmk38 12 de diciembre de 10 a las 5:21

¿Podría decirme dónde puede encontrar algo publicado que respalde esta afirmación? Estoy trabajando con datos y me gustaría usar variables ordinales independientes en regresión logística.

Frederico
fuente
Ver una pregunta similar stats.stackexchange.com/q/195246/3277
ttnphns

Respuestas:

2

Como señala @Scortchi , también puede usar polinomios ortogonales. Aquí hay una demostración rápida en R:

set.seed(3406)
N      = 50
real.x = runif(N, 0, 10)
ord.x  = cut(real.x, breaks=c(0,2,4,6,8,10), labels=FALSE)
ord.x  = factor(ord.x, levels=1:5, ordered=TRUE)
lo.lin = -3 + .5*real.x
p.lin  = exp(lo.lin)/(1 + exp(lo.lin))
y.lin  = rbinom(N, 1, prob=p.lin)

mod.lin = glm(y.lin~ord.x, family=binomial)
summary(mod.lin)
# ...
# Coefficients:
#             Estimate Std. Error z value Pr(>|z|)   
# (Intercept)  0.05754    0.36635   0.157  0.87520   
# ord.x.L      2.94083    0.90304   3.257  0.00113 **
# ord.x.Q      0.94049    0.85724   1.097  0.27260   
# ord.x.C     -0.67049    0.77171  -0.869  0.38494   
# ord.x^4     -0.09155    0.73376  -0.125  0.90071   
# ...
gung - Restablece a Monica
fuente
8

Cualquier buen libro sobre regresión logística tendrá esto, aunque quizás no exactamente con esas palabras. Pruebe el Análisis de datos categóricos de Agresti para obtener una fuente muy autorizada.

También se desprende de la definición de regresión logística (u otras regresiones). Existen pocos métodos explícitamente para variables ordinales independientes. Las opciones habituales son tratarlo como categórico (que pierde el orden) o como continuo (lo que hace que la suposición se establezca en lo que citó). Si lo trata como continuo, entonces el programa que realiza el análisis no sabe que es ordinal. Por ejemplo, suponga que su IV es "¿Cuánto le gusta el presidente Obama?" y sus opciones de respuesta son una escala Likert de 1. "Mucho" a 5. "En absoluto". Si trata esto como continuo, entonces (desde el punto de vista del programa) una respuesta "5" es 5 veces una respuesta "1". Esto puede o no ser irrazonable.

Peter Flom - Restablece a Monica
fuente
3
Sección 5.4.6. Y puede ampliar la idea utilizando polinomios ortogonales para codificar el predictor ordinal.
Scortchi - Restablece a Monica
Gracias por sus comentarios, ayudarán mucho en mi análisis.
Frederico
2
@Frederico, si la respuesta de Peter resolvió su pregunta, debe aceptarla haciendo clic en la marca de verificación debajo del total de votos a la izquierda.
gung - Restablece a Monica