Contexto
He estado leyendo sobre la teoría de respuesta al ítem, y me parece fascinante. Creo que entiendo lo básico, pero me pregunto cómo aplicar técnicas estadísticas relacionadas con el área. A continuación hay dos artículos que son similares al área en la que me gustaría aplicar ITR:
El segundo es el que realmente me gustaría extender en este momento.
He descargado un programa gratuito llamado jMetrik, y parece estar funcionando muy bien. Creo que puede ser demasiado básico en lo que respecta a IRT, pero no estoy seguro.
Sé que la "mejor" forma implicaría aprender R; Sin embargo, no sé si puedo perder el tiempo para abordar esa curva de aprendizaje. Tenga en cuenta que tenemos algunos fondos para comprar software, pero por lo que veo, no parece haber ningún gran programa IRT por ahí.
Preguntas
- ¿Qué piensas sobre la efectividad de jMetrik?
- ¿Cómo sugeriría que avance en la aplicación de IRT?
- ¿Cuáles son los mejores programas para aplicar IRT?
- ¿Alguno de ustedes usa IRT regularmente? ¿Si es así, cómo?
fuente
Respuestas:
Como buen iniciador de IRT, siempre recomiendo leer una guía visual de la teoría de respuesta al ítem .
Se puede encontrar una encuesta del software disponible en www.rasch.org .
Desde mi experiencia, encontré que los comandos Stata de Raschtest (y asociados) son muy útiles en la mayoría de los casos en los que uno está interesado en ajustar el modelo de un parámetro. Para un diseño más complejo, uno puede recurrir a GLLAMM ; Hay un buen ejemplo de trabajo basado en el libro de De Boeck y Wilson, Elementos explicativos y modelos de respuesta (Springer, 2004).
Acerca de R específicamente, hay muchos paquetes que han estado disponibles en los últimos cinco años, ver por ejemplo la Vista de tareas CRAN relacionada . La mayoría de ellos se discuten en un número especial del Journal of Statistical Software (vol. 20, 2007). Como se discutió en otra respuesta, ltm y eRm permiten adaptarse a una amplia gama de modelos IRT. Como se basan en un método de estimación diferente,
ltm
usaron el enfoque marginal mientraseRm
usan el enfoque condicional, elegir uno u otro es principalmente una cuestión del modelo que desea ajustar (eRm
no se ajusta a los modelos de 2 o 3 parámetros) y el objetivo de medición que sigue: la estimación condicional de los parámetros de la persona tiene algunas propiedades psicométricas agradables, mientras que un enfoque marginal le permite cambiar fácilmente al modelo de efectos mixtos, como se discute en los siguientes dos documentos :También hay algunas posibilidades para adaptar los modelos Rasch que utilizan métodos MCMC, consulte, por ejemplo, el paquete MCMCpack (o WinBUGS / JAGS , pero consulte el Código BUGS para la teoría de respuesta al artículo , JSS (2010) 36).
No tengo experiencia con SAS para el modelado IRT, así que se lo dejaré a alguien que esté más versado en la programación de SAS.
Otro software dedicado (utilizado principalmente en la evaluación educativa) incluye: RUMM, Conquest, Winsteps, BILOG / MULTILOG, Mplus (sin citar la lista ya disponible en wikipedia ). Ninguno es de uso gratuito, pero se proponen versiones de demostración de tiempo limitado para algunos de ellos. Encontré jMetrik muy limitado cuando lo probé (hace un año), y todas las funcionalidades ya están disponibles en R. Asimismo, ConstructMap se puede reemplazar de forma segura por lme4 , como se ilustra en el folleto vinculado anteriormente. También debo mencionar
mdltm
(Modelos de rasgos latentes discretos multidimensionales) para modelos Rasch mixtos, de von Davier y col., Que se supone que acompañan al libroModelos Rasch de distribución multivariada y mezcla (Springer, 2007).fuente
ex5.5
A la primera pregunta, no tengo ninguna información sobre jMetrick.
Al aplicar IRT, (como con cualquier otro procedimiento estadístico), el primer paso es usarlo con tantos tipos diferentes de datos como sea posible. Hay una curva de aprendizaje, pero creo que vale la pena.
Una característica importante de IRT es la diferenciación entre los modelos Rasch y los modelos IRT. Fueron desarrollados por diferentes personas para diferentes propósitos. Dicho esto, los modelos IRT son un superconjunto de modelos Rasch.
Los modelos Rasch son modelos de un parámetro: suponen que todos los ítems en un cuestionario son igualmente predictivos del rasgo latente.
Sin embargo, los modelos IRT son dos modelos de parámetros que permiten que las preguntas difieran en su capacidad de proporcionar información sobre la capacidad de los participantes.
Además, hay tres modelos de parámetros que son como los modelos IRT, excepto que permiten un parámetro de adivinanzas para tener en cuenta la capacidad de los participantes de obtener la respuesta correcta por casualidad (esto es más una preocupación en la capacidad que en las pruebas de personalidad).
Además, hay IRT multidimensional que estima múltiples habilidades latentes a la vez. No sé mucho sobre esto, pero es un área que tengo la intención de aprender más.
También hay una distinción entre los métodos IRT dicotómicos y politómicos. Los modelos IRT dicotómicos son los que se usan en las pruebas de habilidad, que tienen una respuesta correcta e incorrecta. Los modelos IRT politómicos se utilizan en pruebas de personalidad, donde hay múltiples respuestas, que son igualmente correctas (en el sentido de que no hay una respuesta correcta).
Yo personalmente uso R para la teoría de respuesta al ítem. Hay dos paquetes principales que he usado,
eRm
que se ajustan solo a los modelos Rasch, yltm
que se ajusta a los modelos de teoría de respuesta a ítems (modelos de dos y tres parámetros). Ambos tienen una funcionalidad similar, y ambos proporcionan más rutinas para modelos IRT dicotómicos. No sé si R es el "mejor" para IRT, no tiene todos los modelos de IRT disponibles, pero ciertamente es el más extensible, ya que uno puede programar estos modelos con relativa facilidad.Utilizo IRT casi exclusivamente para modelos politómicos, en R. Normalmente comienzo con métodos IRT no paramétricos (proporcionados en el paquete
mokken
) para probar los supuestos, y luego proceder con un modelo rasch, agregando más complejidad según sea necesario para obtener un buen ajuste.Para IRT multidimensional, existe el paquete 'mirt', que proporciona esta funcionalidad. No lo he usado, así que realmente no puedo comentar.
Si instala estos paquetes en R y llama a la función 'viñeta ("nombre del paquete"), entonces debería obtener algunas viñetas útiles (definitivamente para
eRm
ymokken
, posiblemente para los demás) que pueden resultarle útiles (dependiendo de su nivel de sofisticación matemática).Finalmente, hay una serie de buenos libros disponibles para modelos rasch y irt. La teoría de respuesta al ítem para psicólogos se usa a menudo (aunque no me gustó el estilo), y más adelante en la cadena de sofisticación técnica, hay dos libros de texto extremadamente completos y útiles: el Manual de la teoría moderna de respuesta al ítem y los modelos Rasch: Fundamentos, recientes Desarrollos y Aplicaciones .
Espero que esto ayude.
fuente
jMetrik es más poderoso de lo que piensas. Está diseñado para el trabajo operativo donde los investigadores necesitan múltiples procedimientos en un solo marco unificado. Actualmente puede estimar los parámetros IRT para los modelos de escala Rasch, crédito parcial y calificación. También permite vincular la escala IRT a través del Stocking-Lord, Haebara y otros métodos. Debido a que incluye una base de datos integrada, el resultado de la estimación IRT se puede usar en la vinculación de escala sin la necesidad de reformar los archivos de datos. Además, todos los resultados se pueden almacenar en la base de datos para usar con otros métodos en jMetrik o programas externos como R.
También puede ejecutarlo con scripts en lugar de la GUI. Por ejemplo, el siguiente código (a) importará datos a la base de datos, (b) puntuará elementos con una clave de respuesta, (c) estimará parámetros del modelo Rasch y (d) exportará datos como un archivo CSV. Puede usar el archivo de salida final como entrada en R para un análisis posterior, o puede usar R para conectarse directamente a la base de datos jMetrik y trabajar con los resultados.
El software aún se encuentra en sus primeras etapas de desarrollo. Actualmente estoy agregando análisis factorial exploratorio y modelos de respuesta de ítems más avanzados. A diferencia de muchos otros programas IRT, jMetrik es de código abierto. Todos los procedimientos de medición utilizan la biblioteca de psicometría que actualmente está disponible en GitHub, https://github.com/meyerjp3/psychometrics . Cualquier persona interesada en contribuir es bienvenida.
fuente
Aquí tiene una lista bastante amplia de preguntas, ¡pero bastante relevante para muchos investigadores!
Le recomiendo que siga adelante en IRT, pero solo si su situación cumple con los requisitos. Por ejemplo, encaja bien con los tipos de pruebas que usa, y probablemente lo más importante es que tiene los tamaños de muestra necesarios. Para los datos dicotómicos de opción múltiple, recomiendo el modelo 3PL (el argumento Rasch de "medición objetiva" es sorprendentemente poco convincente), y 500-1000 es generalmente el tamaño mínimo de muestra. Los datos dicotómicos sin adivinar, como las encuestas psicológicas que tienen respuestas S / N a las declaraciones, funcionan bien con el 2PL. Si tiene una escala de calificación o datos crediticios parciales, existen modelos politómicos diseñados específicamente para esas situaciones.
En mi humilde opinión, el mejor programa para aplicar IRT es Xcalibre. Es relativamente fácil de usar (interfaz gráfica de usuario simple, así como algún tipo de lote de línea de comandos si lo desea por alguna razón) y produce una salida altamente legible (informes de MS Word con tablas y figuras extensas). Recomiendo no usar R por las razones opuestas. El inconveniente, por supuesto, es que no es gratis, pero tiende a obtener lo que paga como dicen. La descripción completa, la salida de ejemplo y una versión de prueba gratuita están disponibles en www.assess.com .
fuente
Mientras tanto, ha publicado un nuevo libro de Frank Baker, Baker Frank B., Seock-Ho Kim. Los fundamentos de la teoría de respuesta al ítem utilizando R. Springer International Publishing (2017) . No utiliza paquetes R pero ofrece fragmentos.
Una lista (llena) de paquetes R para IRT con una descripción sucinta está disponible en CRAN .
fuente