Uso de un conjunto de regresiones logísticas binarias con variable de respuesta categórica de opción múltiple

8

Tengo datos de encuestas categóricas sobre las actitudes de las personas hacia un área política determinada de 13 países. La variable de respuesta es categórica e incluye 4 respuestas distintas que no se pueden ordenar.

Me gustaría construir un modelo multinomial de intersección aleatoria y pendiente aleatoria de varios niveles. El problema es que el número de casos de nivel 2 es solo 13 y el modelo no converge, al menos no en su forma multinomial.

Entonces, como una segunda mejor opción, estoy pensando en recodificar la variable de respuesta en una forma binaria, ejecutar una serie de regresiones logísticas multinivel y luego usar probabilidades pronosticadas para mostrar cómo depende la probabilidad de que se seleccione una determinada categoría de interés en mis variables explicativas. Esto, aparentemente, es solo una segunda mejor opción. Me gustaría saber cuáles son los posibles riesgos de adoptar este enfoque y qué objeciones (de los revisores, supervisores, etc.) debo esperar.

Stefan Domonkos
fuente
1
¿Bajo qué software / algoritmo no está convergiendo su modelo?
probabilidadislogica

Respuestas:

2

La elección entre un multinomio y una serie de regresiones logísticas es en la mayoría de los casos relativamente artificial. Dado que en ambos enfoques selecciona una categoría de referencia (referencia) con respecto a la cual se expresan las razones de posibilidades de todas las demás categorías, generalmente no importa si tiene una u otra si la categoría de referencia sigue siendo igual. La mayor desventaja es que no puede probar restricciones simultáneas de parámetros en los modelos logísticos, lo cual es bastante sencillo en el caso multinomial.

Sin embargo, recomendaría no utilizar efectos aleatorios con 13 países (unidades de nivel 2); consulte, por ejemplo, https://www.statmodel.com/download/SRM2012.pdf .

La alternativa es utilizar un modelo de efectos fijos, donde se incluye un modelo ficticio por país (menos 1). La mayor desventaja de este procedimiento es que probar los efectos a nivel macro no es factible. Si no tiene ninguna hipótesis al respecto, optaría por el modelo multinomial de efectos fijos.

tomka
fuente
0

Le animo a que ejecute este análisis en un modelo (en AMOS) y no creo que su estructura de datos sea problemática (ver por ejemplo: Maas, CJM & Hox, JJ (2005) Tamaños de muestra suficientes para el modelado multinivel. Metodología, 1 , 86-92.). Cuando ejecuta varios modelos en el mismo conjunto de datos, aumenta la posibilidad de cometer errores de tipo I (como mínimo, deberá emplear la corrección de Bonferroni, que se considera una técnica conservadora).

STAToSphere
fuente
1
Su afirmación de que un modelo de efectos aleatorios no es problemático con solo 13 unidades de nivel superior (en este caso, países) no es compartida por todos. Vea, por ejemplo, este estudio de simulación: iser.essex.ac.uk/publications/working-papers/iser/2013-14
Maarten Buis
Estoy de acuerdo, leí y escuché que uno debería tener 20-30 unidades, ver, por ejemplo, Hox et al: statmodel.com/download/SRM2012.pdf
tomka