Similitudes y diferencias entre el modelo IRT y el modelo de regresión logística.

9

A pesar de las similitudes básicas como ambos modelos, la probabilidad de éxito en lugar de modelar la variable de respuesta directamente; Creo que hay respuestas más confiables que señalan las diferencias y similitudes entre estos modelos.

Una diferencia es que, en logística, se puede usar un tipo diferente y un número diferente de variables independientes; mientras que en el modelo IRT solo tenemos una variable independiente que es la habilidad.

Una similitud más: para estimar los parámetros en logística utilizamos el enfoque de máxima verosimilitud. En IRT también utilizamos la probabilidad máxima marginal como uno de los enfoques de estimación de parámetros.

Entonces, ¿alguien puede indicar las diferencias estadísticas / matemáticas en estos dos modelos?

regression logistic mathematical-statistics irt Artiga
fuente

1

IRT (también conocido como análisis de rasgos latentes) a veces se llama análisis de factores logísticos ( ver ). La diferencia entre LR e IRT es paralela a la diferencia entre regresión lineal y análisis factorial. En la regresión, se da la variable dependiente, junto con las variables de manifiesto independientes. En el análisis factorial y otros modelos de variables latentes, latente se extrae de las variables manifiestas dadas; además, es el latente que luego se ve como la variable independiente que "predice" los manifiestos.

ttnphns

@ttnphns, muchas gracias por la respuesta. Entonces, ¿estoy cometiendo un error si estoy refiriendo una variable Y como respuesta a un elemento y luego modelando la probabilidad de que sea correcta? En este escenario, ¿no he conocido mi variable dependiente? Y una pregunta más, ¿la variable de manifiesto te refieres a una dependiente en IRT, verdad?

Artiga

Repetir. En una regresión, usted tiene DVs manifestados Y y IVs manifiestos X. En modelos variables latentes (análisis factorial, IRT, ...) Solo tiene X. Los factores latentes F se extraen de X, pero se extraen para considerarlos. como predictores de X, es decir, sirven los IV para X, que son los DV. En la regresión logística, la DV categórica es una función logística de la combinación lineal de IV (generalmente continuos). En IRT, las variables categóricas observadas son función logística de la combinación lineal de Fs continuas.

ttnphns

11

Eche un vistazo a la Sección 1.6 ("La perspectiva de la regresión lineal") en De Boeck y Wilson (2008) Modelos explicativos de respuesta a ítems ( http://www.springer.com/de/book/9780387402758 ) y Formann, AK (2007) , (Casi) Equivalencia entre estimaciones de probabilidad máxima condicional y mixta para algunos modelos del tipo Rasch, en M. von Davier y CH Carstensen (Eds.), Modelos Rasch multivariados y de distribución de mezcla (pp. 177-189), Nueva York: Saltador.

En resumen: los modelos IRT son modelos de efectos mixtos no lineales generalizados :

el marcador $Y_{pi}\in\left\{ 0,1\right\}$ de un estudiante $p$ a un artículo $i$ es la variable dependiente
dado un rasgo de estudiante muestreado al azar, por ejemplo $\theta_{p}\sim N\left(\mu,\sigma^{2}\right)$ , se supone que las respuestas son independientes distribuidas por Bernoulli,
dado $\theta_{p}$ , el predictor $\eta_{pi}=\textrm{logit}\left(P\left(Y_{pi}=1\right)\right)$ es una combinación lineal de características del artículo $η_{p i} = \sum_{k = 0}^{K} b_{k} X_{i k} + θ_{p} + ε_{p i},$ $\eta_{pi}=\sum_{k=0}^{K}b_{k}X_{ik}+\theta_{p}+\varepsilon_{pi},$
dejar $X_{ik}=-1,$ Si $i=k$ y $X_{ik}=0$ de lo contrario, obtenga el modelo Rasch $P (Y_{p i} = 1 ∣ θ_{p}) = \frac{\exp (θ_{p} - b_{i})}{1 + \exp (θ_{p} - b_{i})};$ $P\left(Y_{pi}=1\mid\theta_{p}\right)=\frac{\exp\left(\theta_{p}-b_{i}\right)}{1+\exp\left(\theta_{p}-b_{i}\right)};$

Tenga en cuenta que los modelos IRT se extienden hacia diferentes aspectos:

Con respecto al poder discriminatorio (2PL) y al índice de adivinanzas (3PL) de un artículo $P (Y_{p i} = 1 ∣ θ_{p}) = c_{i} + (1 - c_{i}) \frac{\exp (a_{i} (θ_{p} - b_{i}))}{1 + \exp (a_{i} (θ_{p} - b_{i}))}$ $P\left(Y_{pi}=1\mid\theta_{p}\right)= c_i+(1-c_i)\frac{\exp\left(a_{i}\left(\theta_{p}-b_{i}\right)\right)}{1+\exp\left(a_{i}\left(\theta_{p}-b_{i}\right)\right)}$
Con respecto a puntajes politómicos $PAGS (Y_{pags yo} = k ∣ θ_{pags}) = \frac{Exp ({una}_{yo k} θ_{pags} - {si}_{yo k})}{\sum_{k = 0 0}^{K} Exp ({una}_{yo k} θ_{pags} - {si}_{yo k})}$ $P\left(Y_{pi}=k\mid\theta_{p}\right)=\frac{\exp\left(a_{ik}\theta_{p}-b_{ik}\right)}{\sum_{k=0}^{K}\exp\left(a_{ik}\theta_{p}-b_{ik}\right)}$
Con respecto a las características conocidas de los estudiantes que constituyen la población (p. Ej., Sexo, estado migratorio) $θ_{pags} \sim norte (Z β, σ^{2}),$ $\theta_{p}\sim N\left(\mathbf{Z}\boldsymbol{\beta},\sigma^{2}\right),$
Con respecto a construir dimensionalidad $PAGS (Y_{pags yo} = 1 ∣ θ_{pags}) = \frac{Exp (\sum_{re} {una}_{yo re} θ_{pags re} - {si}_{yo})}{1 + Exp (\sum_{re} {una}_{yo re} θ_{pags re} - {si}_{yo})}, θ_{pags} \sim {norte}^{re} (μ, Σ)$ $P\left(Y_{pi}=1\mid\theta_{p}\right)=\frac{\exp(\sum_{d}a_{id}\theta_{pd}-b_{i})}{1+\exp(\sum_{d}a_{id}\theta_{pd}-b_{i})},\quad\theta_{p}\sim N^{d}\left(\boldsymbol{\mu},\Sigma\right)$
Con respecto a las clases de habilidades discretas (las distribuciones continuas se pueden aproximar fácilmente por las discretas) $PAGS (Y_{pags yo} = 1 ∣ θ_{pags (l)}) = \frac{Exp (θ_{pags (l)} - {si}_{yo (l)})}{1 + Exp (θ_{pags (l)} - {si}_{yo (l)})}, θ_{pags (l)} \in {θ_{pags (1)}, ..., θ_{pags (L)}}$ $P\left(Y_{pi}=1\mid\theta_{p(l)}\right)=\frac{\exp(\theta_{p(l)}-b_{i(l)})}{1+\exp(\theta_{p(l)}-b_{i(l)})},\quad\theta_{p(l)}\in\left\{ \theta_{p(1)},\dots,\theta_{p(L)}\right\}$

(tomado de las diapositivas useR! 2015 para el paquete R TAM )

Tom
fuente

3

También hay un documento disponible de Boeck et al sobre este jstatsoft.org/article/view/v039i12 más su folleto statmath.wu.ac.at/courses/deboeck/materials/handouts.pdf

Tim

0

La respuesta de @ Tom es excelente, pero me gustaría ofrecer una versión que sea más heurística y que introduzca un concepto adicional.

Regresión logística

Imagina que tenemos una serie de preguntas binarias. Si estamos interesados en la probabilidad de responder sí a cualquiera de las preguntas, y si estamos interesados en el efecto de algunas variables independientes en esa probabilidad, usamos regresión logística:

$P(y_i = 1) = \frac{1}{1 + exp(X\beta)} = logit^-1(X\beta)$

donde indizo las preguntas (es decir, los ítems), X es un vector de características de los encuestados, y $\beta$ es el efecto de cada una de esas características en términos de probabilidades de registro.

IRT

Ahora, tenga en cuenta que dije que teníamos varias preguntas binarias. Esas preguntas podrían llegar a algún tipo de rasgo latente, por ejemplo, capacidad verbal, nivel de depresión, nivel de extraversión. A menudo, estamos interesados en el nivel del rasgo latente en sí.

Por ejemplo, en el Examen de registro de posgrado, estamos interesados en caracterizar la habilidad verbal y matemática de varios solicitantes. Queremos una buena medida de su puntaje. Obviamente, podríamos contar cuántas preguntas alguien respondió correctamente, pero eso trata todas las preguntas como si valieran la misma cantidad: no explica explícitamente el hecho de que las preguntas pueden variar en dificultad. La solución es la teoría de respuesta al ítem. Nuevamente, (por ahora) no estamos interesados en X o $\beta$ , pero solo estamos interesados en la capacidad verbal de la persona, que llamaremos $\theta$ . Utilizamos el patrón de respuestas de cada persona para todas las preguntas para estimar $\theta$ :

$P(y_i = 1) = logit^-1[a_i(\theta_j - b_i)]$

dónde $a_i$ es la discriminación del elemento i y $b_i$ es su dificultad

Entonces, esa es una distinción obvia entre la regresión logística regular y la IRT. En el primero, estamos interesados en los efectos de las variables independientes en una variable dependiente binaria. En este último, usamos un montón de variables binarias (o categóricas) para predecir algún rasgo latente. La publicación original decía que $\theta$ Es nuestra variable independiente. Respetuosamente no estoy de acuerdo, creo que es más como esta es la variable dependiente en IRT.

Utilicé elementos binarios y regresión logística por simplicidad, pero el enfoque generaliza los elementos ordenados y la regresión logística ordenada.

IRT explicativo

Sin embargo, ¿qué pasaría si estuviera interesado en las cosas que predicen el rasgo latente, es decir, las X sy $\beta$ s mencionado anteriormente?

Como se mencionó anteriormente, un modelo para estimar el rasgo latente es simplemente contar el número de respuestas correctas o sumar todos los valores de sus elementos Likert (es decir, categóricos). Eso tiene sus defectos; está asumiendo que cada elemento (o cada nivel de cada elemento) vale la misma cantidad del rasgo latente. Este enfoque es bastante común en muchos campos.

Quizás pueda ver a dónde voy con esto: puede usar IRT para predecir el nivel del rasgo latente, luego realizar una regresión lineal regular. Sin embargo, eso ignoraría la incertidumbre en el rasgo latente de cada persona.

Un enfoque más basado en principios sería utilizar IRT explicativo: usted estima simultáneamente $\theta$ utilizando un modelo IRT y calcula el efecto de sus X s en $\theta$ como si estuvieras usando regresión lineal. Incluso puede ampliar este enfoque para incluir efectos aleatorios para representar, por ejemplo, el hecho de que los estudiantes están anidados en las escuelas.

Más lecturas disponibles en la excelente introducción de Phil Chalmers a su mirtpaquete. Si comprende los aspectos básicos de IRT, iría a la sección IRT de efectos mixtos de estas diapositivas . Stata también es capaz de ajustar modelos IRT explicativos (aunque creo que no puede ajustarse a modelos IRT explicativos de efectos aleatorios como describí anteriormente).

Weiwen Ng
fuente

Similitudes y diferencias entre el modelo IRT y el modelo de regresión logística.

Respuestas:

Regresión logística

IRT

IRT explicativo