Aquí hay una simple pregunta estadística que me dieron. No estoy realmente seguro de entenderlo.
X = el número de puntos adquiridos en un examen (opción múltiple y una respuesta correcta es un punto). ¿Se distribuye X binomial?
La respuesta del profesor fue:
Sí, porque solo hay respuestas correctas o incorrectas.
Mi respuesta:
No, porque cada pregunta tiene una "probabilidad de éxito" diferente p. Como entendí, una distribución binomial es solo una serie de experimentos de Bernoulli, cada uno de los cuales tiene un resultado simple (éxito o fracaso) con una probabilidad de éxito dada p (y todos son "idénticos" con respecto a p). Por ejemplo, lanzar una moneda (regular) 100 veces, esto es 100 experimentos de Bernoulli y todos tienen p = 0.5. Pero aquí las preguntas tienen diferentes tipos de p ¿verdad?
fuente
Respuestas:
Estoy de acuerdo con tu respuesta. Por lo general, este tipo de datos hoy en día se modelaría con algún tipo de modelo de Teoría de respuesta al elemento . Por ejemplo, si utilizó el modelo Rasch , entonces la respuesta binaria se modelaría comoXni
donde puede ser pensado como personas -ésimos capacidad y como -ésima pregunta dificultad. Entonces, el modelo le permite comprender el hecho de que diferentes personas varían en habilidades y las preguntas varían en dificultad, y este es el más simple de los modelos IRT.βn n δi i
La respuesta de sus profesores supone que todas las preguntas tienen la misma probabilidad de "éxito" y son independientes, ya que binomial es una distribución de una suma de ensayo de Bernoulli. Ignora los dos tipos de dependencias descritas anteriormente.n
Como se observó en los comentarios, si observaba la distribución de respuestas de una persona en particular (por lo que no tiene que preocuparse por la variabilidad entre personas) o las respuestas de diferentes personas en el mismo elemento (por lo que no hay variabilidad del ítem), entonces la distribución sería Poisson-binomial, es decir, la distribución de la suma de ensayos de Bernoulli no iid. La distribución podría ser aproximada con binomial o Poisson, pero eso es todo. De lo contrario, está asumiendo el iid.n
Incluso bajo el supuesto "nulo" de adivinar, esto supone que no hay patrones de adivinanzas, por lo que las personas no difieren en cómo adivinan y los elementos no difieren en cómo se adivinan, por lo que la suposición es puramente aleatoria.
fuente
La respuesta a este problema depende de la formulación de la pregunta y de cuándo se obtiene la información. En general, tiendo a estar de acuerdo con el profesor, pero creo que la explicación de su respuesta es deficiente y la pregunta del profesor debería incluir más información por adelantado.
Si considera un número infinito de posibles preguntas del examen, y saca una al azar para la pregunta 1, dibuje una al azar para la pregunta 2, etc. Luego, vaya al examen:
Bajo este marco, se cumplen los supuestos de un experimento binomial.
Por desgracia, los problemas estadísticos mal propuestos son muy comunes en la práctica, no solo en los exámenes. No dudaría en defender su justificación ante su profesor.
fuente
If you consider an infinite number of potential exam questions, and you draw one at random for question 1, draw one at random for question 2, etc.
- Creo que debe hacer explícito el supuesto de que las preguntas del examen se extraen independientemente del conjunto de preguntas potenciales. Sería más realista que estuvieran correlacionados: si la pregunta 1 es fácil, es probable que le den un examen fácil y que la pregunta 2 lo sea.Si hay n preguntas, y puedo responder cualquier pregunta correctamente con probabilidad p, y hay tiempo suficiente para intentar responder todas las preguntas, e hice 100 de estas pruebas, entonces mis puntajes serían distribuidos normalmente con una media de np.
Pero no soy yo repitiendo la prueba 100 veces, son 100 candidatos diferentes haciendo una prueba, cada uno con su propia probabilidad p. La distribución de estos p será el factor primordial. Es posible que tenga una prueba donde p = 0.9 si estudió bien el tema, p = 0.1 si no lo hizo, con muy pocas personas entre 0.1 y 0.9. La distribución de puntos tendrá máximos muy fuertes en 0.1n y 0.9 ny no estará cerca de la distribución normal.
Por otro lado, hay pruebas en las que todos pueden responder cualquier pregunta, pero toman diferentes cantidades de tiempo, por lo que algunos responderán todas las preguntas n, y otros responderán menos porque se les acaba el tiempo. Si podemos suponer que la velocidad de los candidatos está distribuida normalmente, entonces los puntos estarán cerca de la distribución normal.
Pero muchas pruebas contendrán algunas preguntas muy difíciles y otras muy fáciles, intencionalmente para que podamos distinguir entre los mejores candidatos (que responderán todas las preguntas hasta cierto grado de dificultad) y los peores candidatos (que solo podrán responder muy bien). preguntas simples). Esto cambiaría la distribución de puntos con bastante fuerza.
fuente
Por definición, una distribución binomial es un conjunto de ensayos de Bernoulli independientes e idénticamente distribuidos . En el caso de un examen de opción múltiple, cada una de las preguntas sería uno de los ensayos de Bernoulli.n n
El problema aquí surge porque no podemos asumir razonablemente que las preguntas:n
He visto preguntas en las clases de Estadística que modelan las preguntas del examen como binomios, pero están enmarcadas de la siguiente manera:
En este escenario, por supuesto, se representaría como una distribución binomial con .p=14
fuente