Tres puntos sobre la regresión de Poisson vs Normal, todos relacionados con la especificación del modelo:
Efecto de los cambios en los predictores.
Con un predictor continuo como el puntaje de la prueba de matemáticas, la regresión de Poisson (con el enlace de registro habitual) implica que un cambio de unidad en el predictor conduce a un cambio porcentual en el número de premios, es decir, 10 puntos más en la prueba de matemáticas se asocian, por ejemplo, con un 25 por ciento Más premios. Esto depende de la cantidad de premios que el alumno ya tiene previsto. En contraste, la regresión normal asocia 10 puntos más con una cantidad fija, digamos 3 premios más en todas las circunstancias. Debería estar contento con esa suposición antes de usar el modelo que la hace. (fwiw creo que es muy razonable, modulo el siguiente punto).
Tratar con estudiantes sin premios
A menos que haya realmente muchos premios repartidos entre muchos estudiantes, sus recuentos de premios serán en su mayoría bastante bajos. De hecho, predeciría cero inflación, es decir, la mayoría de los estudiantes no reciben ningún premio, por lo que muchos ceros, y algunos buenos estudiantes obtienen bastantes premios. Esto interfiere con los supuestos del modelo de Poisson y es al menos igual de malo para el modelo Normal.
Si tiene una cantidad de datos decente, un modelo 'inflado a cero' o 'obstáculo' sería natural. Se trata de dos modelos unidos: uno para predecir si el estudiante obtiene algún premio y otro para predecir cuántos obtendrá si obtiene alguno (generalmente alguna forma de modelo de Poisson). Esperaría que toda la acción sea en el primer modelo.
Premio exclusividad
Finalmente, un pequeño punto sobre los premios. Si los premios son exclusivos, es decir, si un estudiante obtiene el premio, ningún otro estudiante puede obtener el premio, entonces sus resultados se unen; un recuento para el estudiante a empuja hacia abajo el posible recuento de todos los demás. Si vale la pena preocuparse por esto depende de la estructura de premios y del tamaño de la población estudiantil. Lo ignoraría en un primer paso.
En conclusión, Poisson domina cómodamente a Normal, excepto para recuentos muy grandes, pero verifique los supuestos del Poisson antes de apoyarse en él para inferencia, y prepárese para pasar a una clase de modelo ligeramente más compleja si es necesario.