Trazar e interpretar regresión logística ordinal

19

Tengo una variable dependiente ordinal, facilidad, que varía de 1 (no fácil) a 5 (muy fácil). Los aumentos en los valores de los factores independientes están asociados con una mayor calificación de facilidad.

Dos de mis variables independientes ( condAy condB) son categóricas, cada una con 2 niveles, y 2 ( abilityA, abilityB) son continuas.

Estoy usando el paquete ordinal en R, donde usa lo que creo que es

logit(p(Yg))=lnp(Yg)p(Y>g)=β0g(β1X1++βpXp)(g=1,,k1)

(de la respuesta de @ caracal aquí )

He estado aprendiendo esto de forma independiente y agradecería cualquier ayuda posible, ya que todavía estoy luchando con eso. Además de los tutoriales que acompañan el paquete ordinal, también he encontrado útil lo siguiente:

Pero estoy tratando de interpretar los resultados, juntar los diferentes recursos y me estoy estancando.

  1. He leído muchas explicaciones diferentes, tanto abstractas como aplicadas, pero aún me cuesta trabajo entender qué significa decir:

    Con un aumento de 1 unidad en condB (es decir, cambiando de un nivel al siguiente del predictor categórico), las probabilidades predichas de observar Y = 5 versus Y = 1 a 4 (así como las probabilidades predichas de Y = 4 versus Y = 1 a 3) cambia por un factor de exp (beta) que, para el diagrama, es exp (0.457) = 1.58.

    a. ¿Es esto diferente para las variables independientes categóricas frente a las continuas?
    si. Parte de mi dificultad puede estar en la idea de probabilidades acumulativas y esas comparaciones. ... ¿Es justo decir que pasar de condA = ausente (nivel de referencia) a condA = presente es 1.58 veces más probable que se califique en un nivel más alto de facilidad? Estoy bastante seguro de que eso NO es correcto, pero no estoy seguro de cómo decirlo correctamente.

Gráficamente,
1. Implementando el código en esta publicación , estoy confundido sobre por qué los valores de 'probabilidad' resultantes son tan grandes.
2. La gráfica de p (Y = g) en esta publicación tiene más sentido para mí ... con una interpretación de la probabilidad de observar una categoría particular de Y a un valor particular de X. La razón por la que estoy tratando de obtener El gráfico en primer lugar es obtener una mejor comprensión de los resultados en general.

Aquí está la salida de mi modelo:

m1c2 <- clmm (easiness ~ condA + condB + abilityA + abilityB + (1|content) + (1|ID), 
              data = d, na.action = na.omit)
summary(m1c2)
Cumulative Link Mixed Model fitted with the Laplace approximation

formula: 
easiness ~ illus2 + dx2 + abilEM_obli + valueEM_obli + (1 | content) +  (1 | ID)
data:    d

link  threshold nobs logLik  AIC    niter     max.grad
logit flexible  366  -468.44 956.88 729(3615) 4.36e-04
cond.H 
4.5e+01

Random effects:
 Groups  Name        Variance Std.Dev.
 ID      (Intercept) 2.90     1.70    
 content  (Intercept) 0.24     0.49    
Number of groups:  ID 92,  content 4 

Coefficients:
                Estimate Std. Error z value Pr(>|z|)    
condA              0.681      0.213    3.20   0.0014 ** 
condB              0.457      0.211    2.17   0.0303 *  
abilityA           1.148      0.255    4.51  6.5e-06 ***
abilityB           0.577      0.247    2.34   0.0195 *  

Threshold coefficients:
    Estimate Std. Error z value
1|2   -3.500      0.438   -7.99
2|3   -1.545      0.378   -4.08
3|4    0.193      0.366    0.53
4|5    2.121      0.385    5.50
jc7
fuente
44
+1, es bueno ver una pregunta tan bien investigada y formulada. Bienvenido a CV.
gung - Restablece a Monica

Respuestas:

2

Las notas del curso Mis estrategias de modelado de regresión tienen dos capítulos sobre regresión ordinal que pueden ayudar. Ver también este tutorial.

Las notas del curso detallan qué significan los supuestos del modelo, cómo se verifican y cómo interpretar el modelo ajustado.

Frank Harrell
fuente
Hecho - gracias por la alerta
Frank Harrell