Ejecuté esta regresión logística ordinal en R:
mtcars_ordinal <- polr(as.factor(carb) ~ mpg, mtcars)
Tengo este resumen del modelo:
summary(mtcars_ordinal)
Re-fitting to get Hessian
Call:
polr(formula = as.factor(carb) ~ mpg, data = mtcars)
Coefficients:
Value Std. Error t value
mpg -0.2335 0.06855 -3.406
Intercepts:
Value Std. Error t value
1|2 -6.4706 1.6443 -3.9352
2|3 -4.4158 1.3634 -3.2388
3|4 -3.8508 1.3087 -2.9425
4|6 -1.2829 1.3254 -0.9679
6|8 -0.5544 1.5018 -0.3692
Residual Deviance: 81.36633
AIC: 93.36633
Puedo obtener las probabilidades de registro del coeficiente para mpg
esto:
exp(coef(mtcars_ordinal))
mpg
0.7917679
Y las probabilidades de registro de los umbrales como:
exp(mtcars_ordinal$zeta)
1|2 2|3 3|4 4|6 6|8
0.001548286 0.012084834 0.021262900 0.277242397 0.574406353
¿Podría alguien decirme si mi interpretación de este modelo es correcta:
A medida que
mpg
aumenta en una unidad, las probabilidades de pasar de la categoría 1carb
a cualquiera de las otras 5 categorías, disminuye en -0.23. Si las probabilidades de registro cruzan el umbral de 0.0015, entonces el valor predicho para un automóvil será de categoría 2carb
. Si las probabilidades de registro cruzan el umbral de 0.0121, entonces el valor predicho para un automóvil será de categoría 3carb
, y así sucesivamente.
fuente
mpg
polr
define el modelo comologit P(Y <= k | x) = zeta_k - eta
, si la interpretación de @ StasK no se lee, "A medida quempg
aumenta en una unidad, las probabilidades de observar la categoría 1 decarb
otras 5 categorías aumentan en un 26% (exp(-(-0.2335)) = 1.26
)".En el modelo logit ordenado, las probabilidades forman la razón de la probabilidad de estar en cualquier categoría por debajo de un umbral específico frente a la probabilidad de estar en una categoría por encima del mismo umbral (por ejemplo, con tres categorías: probabilidad de estar en la categoría A o B vs . C, así como la probabilidad de estar en la categoría A vs. B o C).
Esto lleva al modelo
logit P(Y <= k | x) = zeta_k - eta
como se especifica en la descripción depolr()
. Por lo tanto, los odds ratios se pueden construir para diferentes categorías o para diferentes regresores. El último, el más común, compara probabilidades para las mismas categorías pero diferentes regresores e iguales.El odds ratio para diferentes categorías se define como
por lo que la relación es independiente de los regresores. Esta propiedad lleva al nombre alternativo modelo de probabilidades proporcionales.
En este ejemplo simple, pero quizás no muy intuitivo, podría formular: para un aumento de una unidad en el regresor
mpg
, las probabilidades de observar la categoría 1 frente a observar cualquier categoría superior (o las probabilidades de observar cualquier categoría por debajo de un cierto umbral vs. observando cualquier categoría por encima del mismo umbral) se multiplican por 1.26 o aumentan en un 26% (exp(-(-0.233 - 0)) = 1.263
). Si desea formular una razón de probabilidades de diferentes categorías, podría, por ejemplo, decir las probabilidades de estar en la categoría 1 frente a cualquier categoría anterior en comparación con las probabilidades de estar en la categoría 1 o 2 frente a cualquier categoría anterior igual aexp((-6.470) - (-4.415)) = 0.128
. Por lo que la última interpretación no es muy útil en esta configuración específica. Un ejemplo de odds ratio para diferentes categorías podría ser las probabilidades de ir a la universidad en comparación con las probabilidades de ir a la escuela secundaria.fuente