Supuestos de regresión logística multinomial

Respuestas:

6

La suposición clave en el MNL es que los errores se distribuyen de forma independiente e idéntica con una distribución de valor extremo de Gumbel. El problema con probar esta suposición es que se hace a priori . En la regresión estándar, usted ajusta la curva de mínimos cuadrados y mide el error residual. En un modelo logit, usted asume que el error ya está en la medición del punto y calcula una función de probabilidad a partir de ese supuesto.

Una suposición importante es que la muestra sea exógena. Si se basa en la elección, hay correcciones que deben emplearse.

En cuanto a los supuestos sobre el modelo en sí, Train describe tres:

  1. Variación de sabor sistemática y no aleatoria.
  2. Sustitución proporcional entre alternativas (una consecuencia de la propiedad IIA).
  3. No hay correlación serial en el término de error (datos del panel).

La primera suposición que en su mayoría solo tiene que defender en el contexto de su problema. El tercero es en gran medida el mismo, porque los términos de error son puramente aleatorios.

λ=1λ=1

En cuanto a hacer algo de esto en SPSS, no puedo ayudarte más que sugerirte que uses el mlogitpaquete en R en su lugar. Lo siento.

Gregmacfarlane
fuente
Además, el modelo probit multinomial proporciona resultados comparables con un conjunto diferente de supuestos. Por lo tanto, una comparación MNP / MNL también puede ser valiosa.
gregmacfarlane
3

Y

Frank Harrell
fuente
Resulta que esto no siempre es completamente cierto. Ha habido un trabajo (muy) reciente que muestra que se pueden estimar parámetros consistentes para alternativas que nunca se observan, siempre que se tenga información exógena sobre cuál es la frecuencia real de la población. Pero esto requiere un estimador diferente, por lo que en general está en lo correcto.
gregmacfarlane
1
Parece que se requiere un prior bayesiano, no puedo estar en desacuerdo. Pero sin información externa, la logística multinomial sin restricciones tiene una gran cantidad de parámetros para estimar.
Frank Harrell
2

El gmacfarlano ha sido muy claro. Pero para ser más precisos, y supongo que realiza un análisis de sección transversal, el supuesto central es el IIA (independencia de alternativas irrelevantes). No puede forzar el ajuste de sus datos en el supuesto IIA, debe probarlos y esperar que se cumplan. Spss no pudo manejar la prueba hasta 2010 con seguridad. R, por supuesto, lo hace, pero podría ser más fácil para usted migrar a stata e implementar las pruebas IIA proporcionadas por los comandos de mlogit postestimation.

Si el IIA no se cumple, el logit multinomial mixto o el logit anidado son alternativas razonables. El primero se puede estimar dentro del gllamm, el segundo con el comando nlogit mucho más parsimonioso.

JDav
fuente