A pesar de las similitudes básicas como ambos modelos, la probabilidad de éxito en lugar de modelar la variable de respuesta directamente; Creo que hay respuestas más confiables que señalan las diferencias y similitudes entre estos modelos.
Una diferencia es que, en logística, se puede usar un tipo diferente y un número diferente de variables independientes; mientras que en el modelo IRT solo tenemos una variable independiente que es la habilidad.
Una similitud más: para estimar los parámetros en logística utilizamos el enfoque de máxima verosimilitud. En IRT también utilizamos la probabilidad máxima marginal como uno de los enfoques de estimación de parámetros.
Entonces, ¿alguien puede indicar las diferencias estadísticas / matemáticas en estos dos modelos?
Respuestas:
Eche un vistazo a la Sección 1.6 ("La perspectiva de la regresión lineal") en De Boeck y Wilson (2008) Modelos explicativos de respuesta a ítems ( http://www.springer.com/de/book/9780387402758 ) y Formann, AK (2007) , (Casi) Equivalencia entre estimaciones de probabilidad máxima condicional y mixta para algunos modelos del tipo Rasch, en M. von Davier y CH Carstensen (Eds.), Modelos Rasch multivariados y de distribución de mezcla (pp. 177-189), Nueva York: Saltador.
En resumen: los modelos IRT son modelos de efectos mixtos no lineales generalizados :
Tenga en cuenta que los modelos IRT se extienden hacia diferentes aspectos:
(tomado de las diapositivas useR! 2015 para el paquete R TAM )
fuente
La respuesta de @ Tom es excelente, pero me gustaría ofrecer una versión que sea más heurística y que introduzca un concepto adicional.
Regresión logística
Imagina que tenemos una serie de preguntas binarias. Si estamos interesados en la probabilidad de responder sí a cualquiera de las preguntas, y si estamos interesados en el efecto de algunas variables independientes en esa probabilidad, usamos regresión logística:
donde indizo las preguntas (es decir, los ítems), X es un vector de características de los encuestados, yβ es el efecto de cada una de esas características en términos de probabilidades de registro.
IRT
Ahora, tenga en cuenta que dije que teníamos varias preguntas binarias. Esas preguntas podrían llegar a algún tipo de rasgo latente, por ejemplo, capacidad verbal, nivel de depresión, nivel de extraversión. A menudo, estamos interesados en el nivel del rasgo latente en sí.
Por ejemplo, en el Examen de registro de posgrado, estamos interesados en caracterizar la habilidad verbal y matemática de varios solicitantes. Queremos una buena medida de su puntaje. Obviamente, podríamos contar cuántas preguntas alguien respondió correctamente, pero eso trata todas las preguntas como si valieran la misma cantidad: no explica explícitamente el hecho de que las preguntas pueden variar en dificultad. La solución es la teoría de respuesta al ítem. Nuevamente, (por ahora) no estamos interesados en X oβ , pero solo estamos interesados en la capacidad verbal de la persona, que llamaremos θ . Utilizamos el patrón de respuestas de cada persona para todas las preguntas para estimarθ :
dóndeunayo es la discriminación del elemento i ysiyo es su dificultad
Entonces, esa es una distinción obvia entre la regresión logística regular y la IRT. En el primero, estamos interesados en los efectos de las variables independientes en una variable dependiente binaria. En este último, usamos un montón de variables binarias (o categóricas) para predecir algún rasgo latente. La publicación original decía queθ Es nuestra variable independiente. Respetuosamente no estoy de acuerdo, creo que es más como esta es la variable dependiente en IRT.
Utilicé elementos binarios y regresión logística por simplicidad, pero el enfoque generaliza los elementos ordenados y la regresión logística ordenada.
IRT explicativo
Sin embargo, ¿qué pasaría si estuviera interesado en las cosas que predicen el rasgo latente, es decir, las X syβ s mencionado anteriormente?
Como se mencionó anteriormente, un modelo para estimar el rasgo latente es simplemente contar el número de respuestas correctas o sumar todos los valores de sus elementos Likert (es decir, categóricos). Eso tiene sus defectos; está asumiendo que cada elemento (o cada nivel de cada elemento) vale la misma cantidad del rasgo latente. Este enfoque es bastante común en muchos campos.
Quizás pueda ver a dónde voy con esto: puede usar IRT para predecir el nivel del rasgo latente, luego realizar una regresión lineal regular. Sin embargo, eso ignoraría la incertidumbre en el rasgo latente de cada persona.
Un enfoque más basado en principios sería utilizar IRT explicativo: usted estima simultáneamenteθ utilizando un modelo IRT y calcula el efecto de sus X s enθ como si estuvieras usando regresión lineal. Incluso puede ampliar este enfoque para incluir efectos aleatorios para representar, por ejemplo, el hecho de que los estudiantes están anidados en las escuelas.
Más lecturas disponibles en la excelente introducción de Phil Chalmers a su
mirt
paquete. Si comprende los aspectos básicos de IRT, iría a la sección IRT de efectos mixtos de estas diapositivas . Stata también es capaz de ajustar modelos IRT explicativos (aunque creo que no puede ajustarse a modelos IRT explicativos de efectos aleatorios como describí anteriormente).fuente