Coeficiente negativo en regresión logística ordenada

17

Supongamos que tenemos la respuesta ordinal y:{Bad, Neutral, Good}{1,2,3} y un conjunto de variables que creemos que explicará . Luego hacemos una regresión logística ordenada de (matriz de diseño) en (respuesta).X:=[x1,x2,x3]yXy

Suponga que el coeficiente estimado de , , en la regresión logística ordenada es . ¿Cómo interpreto el odds ratio (OR) de ?x1β^10.5e0.5=0.607

¿Debo decir "para un aumento de 1 unidad en , ceteris paribus, las probabilidades de observar son veces las probabilidades de observar , y para el mismo cambio en , las probabilidades de observar son veces las probabilidades de observar "?x1Good0.607BadNeutralx1NeutralGood0.607Bad

No puedo encontrar ningún ejemplo de interpretación de coeficientes negativos en mi libro de texto o en Google.

mdewey
fuente
2
Si, eso es correcto. Es casi idéntico a cómo interpreta los coeficientes positivos.
Peter Flom - Restablece a Monica
2
NB: generalmente decimos "regresión en ", no al revés. yX
gung - Restablecer Monica

Respuestas:

25

Está en el camino correcto, pero siempre eche un vistazo a la documentación del software que está utilizando para ver qué modelo se ajusta realmente. Suponga una situación con una variable dependiente categórica con categorías ordenadas 1 , ... , g , ... , k y predictores X 1 , ... , X j , ... , X p .Y1,,g,,kX1,,Xj,,Xp

"In the wild", puede encontrar tres opciones equivalentes para escribir el modelo teórico de probabilidades proporcionales con diferentes significados de parámetros implícitos:

  1. logit(p(Yg))=lnp(Yg)p(Y>g)=β0g+β1X1++βpXp(g=1,,k1)
  2. logit(p(Yg))=lnp(Yg)p(Y>g)=β0g(β1X1++βpXp)(g=1,,k1)
  3. logit(p(Yg))=lnp(Yg)p(Y<g)=β0g+β1X1++βpXp(g=2,,k)

(Los modelos 1 y 2 tienen la restricción de que en las regresiones logísticas binarias separadas , la β j no varía con g , y β 0 1 < < β 0 g < < β 0 k - 1 , el modelo 3 tiene la misma restricción sobre el β j , y requiere que β 0 2 > ... > β 0 g > ... > β 0 k )k1βjgβ01<<β0g<<β0k1βjβ02>>β0g>>β0k

  • En el modelo 1, un positivo significa que un aumento en predictor X j se asocia con mayores probabilidades para un menor categoría en Y .βjXjY
  • El modelo 1 es algo contradictorio, por lo tanto, el modelo 2 o 3 parece ser el preferido en el software. Aquí, a positivos significa que un aumento en predictor X j se asocia con mayores probabilidades para un mayor categoría en Y .βjXjY
  • Los modelos 1 y 2 conducen a las mismas estimaciones para , pero sus estimaciones para β j tienen signos opuestos.β0gβj
  • Los modelos 2 y 3 conducen a las mismas estimaciones para , pero sus estimaciones para β 0 g tienen signos opuestos.βjβ0g

Suponiendo que su software usa el modelo 2 o 3, puede decir "con un aumento de 1 unidad en , ceteris paribus, las probabilidades pronosticadas de observar ' Y = Bueno ' versus observar ' Y = Neutral O Malo ' por un factor de e β 1 = 0,607 . "y del mismo modo" con un aumento de 1 unidad en X 1 , ceteris paribus, los predichos probabilidades de observar ' y = bueno o neutral ' vs. observando ' y = inadecuado ' cambio en un factor de e βX1Y=GoodY=Neutral OR Badeβ^1=0.607X1Y=Good OR NeutralY=Bad. "Tenga en cuenta que en el caso empírico, solo tenemos las probabilidades predichas, no las reales.eβ^1=0.607

Aquí hay algunas ilustraciones adicionales para el modelo 1 con categorías. Primero, la suposición de un modelo lineal para los logits acumulativos con probabilidades proporcionales. En segundo lugar, las probabilidades implícitas de observar en la mayoría de las categorías g . Las probabilidades siguen funciones logísticas con la misma forma. k=4gingrese la descripción de la imagen aquí

Para las probabilidades de categoría en sí, el modelo representado implica las siguientes funciones ordenadas: ingrese la descripción de la imagen aquí

PD: Que yo sepa, el modelo 2 se usa en SPSS, así como en funciones R MASS::polr()y ordinal::clm(). El modelo 3 se usa en funciones R rms::lrm()y VGAM::vglm(). Desafortunadamente, no sé acerca de SAS y Stata.

lince
fuente
Yglm(..., family=binomial)
¿Tiene una referencia que aborde la forma de expresar la especificación n. ° 2 en su lista de 3 alternativas?
1
@ Harokitty Se describe brevemente en el "Análisis de datos categóricos ordinarios " de Agresti, sección 3.2.2, p49, ecuación 3.8 . Alternativamente, en el "Análisis de datos categóricos" de Agresti, sección 9.4, p323, ecuación 9.12.
caracal
Hola, lamento molestarte, ¿tienes una referencia para la tercera? Agresti no parece hablar de eso.
2
logit(Y>g)logit(Yg)