Estoy usando un modelo logit. Mi variable dependiente es binaria. Sin embargo, tengo una variable independiente que es categórica y contiene las respuestas: 1.very good, 2.good, 3.average, 4.poor and 5.very poor
. Entonces, es ordinal ("categórico cuantitativo"). No estoy seguro de cómo manejar esto en el modelo. Estoy usando gretl
.
[Nota de @ttnphns: aunque la pregunta dice que el modelo es logit (porque el dependiente es categórico), el problema crucial, las variables independientes ordinales , es básicamente similar, sea el dependiente categórico o cuantitativo. Por lo tanto, la pregunta es igualmente relevante para, digamos, la regresión lineal también, como lo es para la regresión logística u otro modelo logit.]
Respuestas:
El problema con la variable independiente ordinal es que, por definición, los verdaderos intervalos métricos entre sus niveles no son conocen , no se puede suponer una relación de tipo apropiada, aparte del paraguas "monotónico", a priori. Tenemos que hacer algo al respecto, por ejemplo: "seleccionar o combinar variantes" o "preferir lo que maximiza algo".
Si insiste en tratar su likert rating IV como ordinal (en lugar de intervalo o nominal), tengo un par de alternativas para usted.
También podría haber otras sugerencias. Los tres anteriores son lo que me viene a la mente al instante al leer su pregunta.
Permítame recomendarle también que visite estos hilos: Asociación entre nominal y escala u ordinal ; Asociación entre ordinal y escala . Podrían ser útiles a pesar de que no se trata de regresiones específicas.
Pero estos hilos son sobre regresiones, particularmente logísticas: debes mirar adentro: uno , dos , tres , cuatro , cinco .
fuente
Solo para agregar a las otras excelentes respuestas: una forma moderna de manejarlo podría ser a través de un modelo aditivo, que representa la variable independiente ordinal a través de una spline. Si está bastante seguro de que el efecto de la variable es monótono, puede restringirlo a una spline monótona. (Para ver un ejemplo de splines monótonos en uso, consulte Buscar una función que se ajuste a la curva sigmoidea ).
En R, si hace que el predictor ordinal sea un "factor ordenado" (con, por ejemplo, el código
ord <- factor(sample(1:5,20,replace=TRUE),ordered=TRUE)
), en un modelo lineal se representará mediante polinomios ortogonales.fuente
Necesita variables ficticias pero necesitak - 1 variables ficticias, donde k es el número de respuestas potenciales En su caso con 5 valores de respuesta (1-5) crearía 4 variables ficticias. Cuando una respuesta es "5", sus cuatro variables ficticias serían todos ceros. ¿Tener sentido?
fuente