Suponga que un supervisor sospecha que un alumno copia las respuestas del papel de otro alumno durante un examen de opción múltiple. Más tarde verifica sus respuestas y encuentra algunas similitudes, pero por otro lado, es probable que haya similitudes dada la naturaleza del examen. ¿Cómo debería determinar si sus sospechas fueron fundadas?
En otras palabras, seguramente tendrá que comparar los exámenes con los de otros estudiantes (que, supongamos, no estaban haciendo trampa). Pero si el tamaño de la clase es muy grande, ¿es razonable tomar una muestra aleatoria para comparar? ¿Cuántos tomaría ella entonces? Si hubiera muchas preguntas en el examen, ¿también sería razonable tomar una muestra de las preguntas para compararlas? ¿Hace una diferencia significativa si cada pregunta tenía 2 respuestas posibles (verdadero / falso) o, por ejemplo, 4?
No tengo ningún número específico porque me pregunto cómo funcionaría esto en general. Tengo experiencia en matemáticas pero poca capacitación en estadística. ¿Cómo describirías este análisis en términos estadísticos?
Gracias.
fuente
Respuestas:
Aquí hay una gama sorprendentemente amplia de los índices de copia de respuestas, aunque con poca discusión sobre sus méritos: http://www.bjournal.co.uk/paper/BJASS_01_01_06.pdf .
Hay un campo de psicología (educativa) llamado teoría de respuesta al ítem (IRT) que proporciona el fondo estadístico para preguntas como estas. Si usted es estadounidense y realizó un SAT, ACT o GRE, se enfrentó a una prueba desarrollada teniendo en cuenta IRT. El postulado básico de IRT es que cada estudiantei se caracteriza por su habilidad ai ; cada pregunta se caracteriza por su dificultadbj ; y la probabilidad de responder una pregunta correctamente es
Para las preguntas "Sí / No", este puede ser el final de la historia. Para más de dos preguntas de categoría, podemos hacer una suposición adicional de que todas las elecciones incorrectas son igualmente probables; por una preguntaj con kj elecciones, la probabilidad de cada elección incorrecta es π′(ai,bj;c)=[1−π(ai,bj;c)]/(kj−1) .
Para estudiantes de habilidades.ai y ak , la probabilidad de que coincidan en sus respuestas para una pregunta con dificultad bj es
Ahora, puede calcular la probabilidad de coincidencia, pero probablemente será combinatoriamente minúscula. Una mejor medida puede ser la relación de la información en el patrón de respuestas en pares,
Los parámetros de la prueba{c,bj,j=1,2,…} y habilidades estudiantiles {ai} no caerán del cielo azul, pero son fácilmente estimables en software moderno como R con
lme4
o paquetes similares:o algo muy parecido a esto.
fuente