Tengo datos de encuestas categóricas sobre las actitudes de las personas hacia un área política determinada de 13 países. La variable de respuesta es categórica e incluye 4 respuestas distintas que no se pueden ordenar.
Me gustaría construir un modelo multinomial de intersección aleatoria y pendiente aleatoria de varios niveles. El problema es que el número de casos de nivel 2 es solo 13 y el modelo no converge, al menos no en su forma multinomial.
Entonces, como una segunda mejor opción, estoy pensando en recodificar la variable de respuesta en una forma binaria, ejecutar una serie de regresiones logísticas multinivel y luego usar probabilidades pronosticadas para mostrar cómo depende la probabilidad de que se seleccione una determinada categoría de interés en mis variables explicativas. Esto, aparentemente, es solo una segunda mejor opción. Me gustaría saber cuáles son los posibles riesgos de adoptar este enfoque y qué objeciones (de los revisores, supervisores, etc.) debo esperar.
fuente
Respuestas:
La elección entre un multinomio y una serie de regresiones logísticas es en la mayoría de los casos relativamente artificial. Dado que en ambos enfoques selecciona una categoría de referencia (referencia) con respecto a la cual se expresan las razones de posibilidades de todas las demás categorías, generalmente no importa si tiene una u otra si la categoría de referencia sigue siendo igual. La mayor desventaja es que no puede probar restricciones simultáneas de parámetros en los modelos logísticos, lo cual es bastante sencillo en el caso multinomial.
Sin embargo, recomendaría no utilizar efectos aleatorios con 13 países (unidades de nivel 2); consulte, por ejemplo, https://www.statmodel.com/download/SRM2012.pdf .
La alternativa es utilizar un modelo de efectos fijos, donde se incluye un modelo ficticio por país (menos 1). La mayor desventaja de este procedimiento es que probar los efectos a nivel macro no es factible. Si no tiene ninguna hipótesis al respecto, optaría por el modelo multinomial de efectos fijos.
fuente
Le animo a que ejecute este análisis en un modelo (en AMOS) y no creo que su estructura de datos sea problemática (ver por ejemplo: Maas, CJM & Hox, JJ (2005) Tamaños de muestra suficientes para el modelado multinivel. Metodología, 1 , 86-92.). Cuando ejecuta varios modelos en el mismo conjunto de datos, aumenta la posibilidad de cometer errores de tipo I (como mínimo, deberá emplear la corrección de Bonferroni, que se considera una técnica conservadora).
fuente