Alternativas al modelo logit multinomial

8

Estoy tratando de estimar un modelo de elección ocupacional con tres opciones. ¿Hay alguna alternativa al uso de la regresión logística multinomial cuando se manejan resultados categóricos tan desordenados?

Cuando se trata de variables dependientes binarias, parece haber varias opciones, como el modelo LPM y el modelo binario probit y logit. Sin embargo, cuando se trata con variables categóricas desordenadas, la literatura sigue recomendando el modelo logit multinomial sin compararlo con alternativas.

Thor
fuente
1
¿Está preguntando si hay funciones de enlace alternativas (además del logit) disponibles para el caso multinomial? ¿O está preguntando acerca de los diferentes tipos de modelos (como los modelos de carro )? O tal vez algo más? (Nota al margen, si la primera, que podría ayudarle a leer mi respuesta aquí: diferencia entre el logit-y-probit-modelos , para obtener información general sobre este tema, a pesar de que fue escrito en un contexto ligeramente diferente.)
Gung - Restablece a Monica
Muchas gracias por el comentario. Definitivamente voy a leer en el enlace. Principalmente me pregunto si hay alguna alternativa que use la regresión lineal ordinaria (OLS) para manejar resultados categóricos no ordenados. ¿Conoces alguna de esas alternativas? Cuando se trata de resultados binarios, parece haber una discusión completa sobre si usar OLS o modelos binarios logit / probit.
Thor
Para una primera aproximación, OLS nunca debe usarse para resultados binarios. Estoy seguro de que hay, o podría haber, algoritmos de regresión multinomiales que usan funciones de enlace alternativas, pero no sé si el software principal los admite.
gung - Restablece a Monica
1
No estoy seguro de lo que quieres decir con primera aproximación (lo siento, soy un novato). Pero parece que algunos econométricos prominentes argumentan que usar un modelo LPM funciona tan bien como el modelo logit cuando se estiman los resultados binarios. Al menos Angrist y Pischke lo hacen en su libro 'Economometría mayormente inofensiva' (2009). ¿Tiene algún consejo sobre dónde puedo leer sobre tales funciones alternativas de enlace? Nuevamente, gracias por sus comentarios.
Thor
1
"Para una primera aproximación ... nunca ..." significa que el 99% del tiempo no debe usar OLS con un resultado binario. Soy consciente de que hay algunos casos en los que hace menos diferencia y que algunas personas no están de acuerdo con el consejo estándar; es por eso que no dije simplemente 'nunca' sin los setos. Desafortunadamente, no conozco un buen lugar para leer sobre el uso de funciones de enlace alternativas con regresión multinomial.
gung - Restablece a Monica

Respuestas:

3

Hay una variedad de modelos disponibles para modelar modelos multinomiales.

Recomiendo Cameron & Trivedi Microeconometrics Using Stata para una introducción fácil y excelente o eche un vistazo a las diapositivas de la conferencia Imbens & Wooldridge o aquí, que están disponibles en línea.

Los modelos ampliamente utilizados incluyen:

regresión logística multinomial o mlogit en Stata

logit condicional multinomial (permite incluir fácilmente no solo predictores individuales sino también predictores específicos de elección) o asclogit en Stata

logit anidado (relaje la independencia del supuesto de alternativas irrelevantes (IIA) agrupando / clasificando las opciones de forma jerárquica) o nlogit en Stata

logit mixto (relaja la suposición del IIA suponiendo, por ejemplo, parámetros distribuidos normales) o mixlogit en Stata.

modelo probit multinomial (puede relajar aún más la suposición de IIA pero debe tener predictores específicos de elección disponibles) logit mixto (relaja la suposición de IIA suponiendo, por ejemplo, parámetros distribuidos normales), usar asmprobit en Stata (mprobit no permite usar predictores específicos de elección pero debe usarlos para relajar la asunción del IIA )

Arne Jonas Warnke
fuente
1
¿Puedo preguntar por qué mixto logit relaja IIA? me parece que el logit mixto es solo logit bayesiano en el que la distribución posterior deβes una mezcla (número de modos == número de individuos)
ElleryL
Sí, por supuesto, gracias, consulte Wikipedia para obtener una explicación: https://en.wikipedia.org/wiki/Mixed_logit
Arne Jonas Warnke
2

Si desea opciones bastante diferentes de una regresión logística, podría usar una red neuronal. Por ejemplo, el nnetpaquete de R tiene una multinomfunción. O podría usar un bosque aleatorio ( randomForestpaquete de R y otros). Y hay varias otras alternativas de Machine Learning, aunque las opciones como un SVM tienden a no estar bien calibradas, lo que hace que sus resultados sean inferiores, en mi opinión, a una regresión logística.

[En realidad, las neuronas de la red neuronal probablemente utilizan un logit debajo del capó. Entonces es bastante diferente, pero no muy diferente al mismo tiempo.]

Wayne
fuente
+1. Solo para ampliar en un par de puntos ... Los SVM se pueden calibrar después del entrenamiento para producir buenas probabilidades (por ejemplo, usando el escalado de Platt o la regresión isotónica, a costa de un paso adicional). Se puede considerar que las redes neuronales con salidas softmax (y cualquier tipo de función de activación no lineal en las capas ocultas) aprenden simultáneamente un mapeo no lineal en algún espacio de características y realizan una regresión logística multinomial en ese espacio de características.
user20160
@Wayne; Me pregunto que, dado que logit multinomial requiere una suposición de IIA; ¿pero sobre la red neuronal con activación softmax? ¿También requiere la misma suposición?
ElleryL
0

Además, piense que las redes neuronales (con activación softmax), los árboles de decisión (o los bosques aleatorios) no requieren que se cumpla la suposición del IIA considerando la poca confiabilidad de estas pruebas relacionadas con la verificación de la suposición del IIA. Por lo tanto, esto podría ser una ventaja en comparación con la logística multinomial si todo lo que nos preocupa son solo predicciones.

Alternativamente, se pueden construir múltiples modelos logísticos para las categorías K-1 con la categoría Kth como referencia. Esto también permite conectar diferentes predictores para cada una de las ecuaciones en contraste con el multinomio

SrikanthRaja
fuente
1
Esto es más bien un comentario que una respuesta. Podemos convertir su respuesta en un comentario o puede extender su respuesta.
Ferdi
¿podría explicar por qué las redes neuronales (con activación softmax) no requieren la suposición del IIA. de acuerdo con esto, en.wikipedia.org/wiki/Luce%27s_choice_axiom Creo que las redes neuronales (con activación softmax) tienen la misma restricción
ElleryL