Hay una pregunta popular, llamada "La mejor pregunta de estadística".
Si elige una respuesta a esta pregunta al azar, ¿cuál es la probabilidad de que esté en lo correcto?
A) 25% B) 50% C) 60% D) 25%
Esta tarea no es muy difícil, la respuesta correcta es 0%. Pero si lo modificamos así:
Si elige una respuesta a esta pregunta al azar, ¿cuál es la probabilidad de que esté en lo correcto?
A) 50% B) 25% C) 60% D) 50%
¿Cuál será la respuesta correcta? ¿Tenemos dos respuestas correctas: 25% y 50%, o no hay una respuesta correcta, ya que con estas dos respuestas correctas, la posibilidad de elegir la respuesta correcta es de hecho el 75% (pero no tenemos el 75% escrito en el escritorio) )?
Por cierto. ¿La respuesta 0% sigue siendo la respuesta correcta, la tercera respuesta correcta en este caso?
fuente
Respuestas:
Las paradojas aparentes (de lógica o probabilidad) pueden resolverse enmarcando las preguntas de manera clara y cuidadosa.
El siguiente análisis está motivado por la idea de defender una respuesta: cuando un examinado puede exhibir un posible estado de cosas (consistente con toda la información disponible) en el que su respuesta es correcta, entonces debe marcarse como correcta. De manera equivalente, una respuesta es incorrecta cuando no existe tal defensa; se considera correcto de lo contrario. Esto modela las interacciones habituales entre calificadores (benevolentes, racionales) y examinadores (racionales) :-). La aparente paradoja se resuelve exhibiendo múltiples defensas para la segunda pregunta, solo una de las cuales podría aplicarse en cualquier caso.
Tomaré el significado de "aleatorio" en estas preguntas en un sentido convencional: para modelar una elección aleatoria de respuesta, escribiré cada respuesta en un trozo de papel ("ticket") y la pondré en un recuadro: eso será Cuatro entradas en total. Sacar un boleto de la caja (después de barajar cuidadosamente y ciegamente el contenido de la caja) es un modelo físico para una elección "aleatoria". Motiva y justifica un modelo de probabilidad correspondiente .
Ahora, ¿qué significa "ser correcto"? En mi ignorancia, exploraré todas las posibilidades. En cualquier caso, considero definitivo que cero, uno o incluso más boletos pueden ser "correctos". (¿Cómo podría saberlo? ¡Simplemente consulto la hoja de calificación!) Marcaré las respuestas "correctas" como tales escribiendo el valor en cada boleto correcto y escribiendo en las demás. Eso es rutina y no debería ser controvertido.1 0
Una cosa obvia pero importante a tener en cuenta es que la regla para escribir o debe basarse únicamente en la respuesta escrita en cada ticket: matemáticamente, es un mapeo (o reasignación) que envía el conjunto de respuestas enumeradas ( en ambas preguntas) en el conjunto . Esta regla es necesaria para la autoconsistencia.0 1 {.25,.50,.60} {0,1}
Pasemos al elemento probabilístico de la pregunta: por definición, la posibilidad de ser correcta, bajo un sorteo aleatorio de tickets, es la expectativa de los valores con los que se han marcado. La expectativa se calcula sumando los valores en los tickets y dividiéndolos por su número total. Por lo tanto, será , , , o .0 .25 .50 .75 1
Una marca tendrá sentido siempre que solo los tickets cuyas respuestas sean iguales a la expectativa estén marcados con s1 . Este también es un requisito de autoconsistencia. Afirmo que este es el quid de la cuestión: encontrar e interpretar las marcas que tienen sentido. Si no hay ninguno, entonces la pregunta en sí misma puede ser calificada como sin sentido. Si hay una marca única, entonces no habrá controversia. Solo si dos o más marcas tienen sentido, habrá alguna dificultad potencial.
¿Qué marcas tienen sentido?
Ni siquiera necesitamos hacer una búsqueda exhaustiva. En la primera pregunta , las expectativas enumeradas en los boletos son del 25%, 50% y 60%. Esto último es imposible con cuatro boletos. El primero requeriría exactamente un boleto para ser marcado; el segundo, dos entradas. Eso da como máximo posibles marcas para explorar. La única marca que tiene sentido pone s en cada ticket. Para esta marca, la expectativa es . Eso justifica la respuesta declarada a la primera pregunta. (¡Podría decirse que la única respuesta correcta a la primera pregunta es no seleccionar ninguna respuesta!)3+3=6 0 (0+0+0+0)/4=0
En la segunda pregunta , aparecen las mismas respuestas y una vez más hay seis marcas para explorar. Esta vez, tres marcas son autoconsistentes. Los tabulo:
Por lo tanto, hay tres posibles definiciones distintas de "correcto" en el segundo problema, lo que lleva a que A o D sean correctas (en la solución 1) o que solo B sea correcta (en la solución 2), o que ninguna de las respuestas sea correcta (en solución 3).
Una forma de interpretar este estado de cosas es que para cada una de las respuestas A, B y D, existe al menos una forma de marcar los tickets que hace que esas respuestas sean correctas. Esto no implica que los tres sean simultáneamente correctos: no podrían serlo, porque . Si usted fuera el calificador de la prueba, entonces si marcó correctamente A, B o D, entonces no obtendría un argumento del examinado; pero si marcó alguno de ellos incorrecto,.25≠.50 el examinado tendrá una base legítima para disputar su puntaje: invocará la solución 1 o la solución 2. De hecho, si un examinado se niega a responder la pregunta, la solución 3 le dará una base legítima para argumentar que no ¡La respuesta también debería obtener crédito completo!
En resumen, este análisis aborda la segunda parte de la pregunta al concluir que cualquiera de las siguientes respuestas a la pregunta 2 debe marcarse como correcta porque cada una de ellas es defendible : A, B, D, A y D, y nada. No se puede defender ninguna otra respuesta y, por lo tanto, no sería correcta.
fuente
Creo que hay un problema de semántica aquí además de la probabilidad. Elegir al azar es claro. Cada uno de A, B, C y D se seleccionará un 25%. Pero, ¿qué significa ser correcto cuando escoges al azar? Parece que debería significar dado que elige A does As answer da el% correcto de muestras que serán correctas y lo mismo para B, C y D. Por lo tanto, debe contar 1/4 para cada respuesta correcta y sumar todas las respuestas correctas para obtener el porcentaje correcto. Pero esto lleva a un argumento circular. De ahí la paradoja. Esto realmente parece ser una cuestión de lógica más que de probabilidad o estadística.
fuente
whuber ofrece un excelente análisis donde se permiten múltiples respuestas. Sin embargo, también hay una manera consistente de entender la pregunta de tal manera que solo haya una respuesta correcta (aunque necesitamos decir esto como parte de la pregunta):
Nuevamente, definiremos una respuesta "correcta" como una que sea racionalmente defendible y siga el argumento de whuber. Una marca es un mapa del conjunto de respuestas a modo que las respuestas correctas se envían a 1 y las respuestas incorrectas a 0. Hay tres posibles marcas autoconsistentes:{0,1}
Sin embargo, necesitamos otro paso lógico para reducirlos a una sola respuesta defendible. Al resolver este problema, el maestro se enfrentó a tres posibles marcas, cada una de las cuales podría ser una respuesta única tan aceptable como las otras. Sin embargo, como solo una respuesta puede ser correcta, el maestro debe elegir al azar entre ellos. Esto asigna una probabilidad igual a cada marca para que:
Esto da como resultado la expectativa de que el estudiante tendrá razón % del tiempo. Por lo tanto, el 25% debe ser la respuesta correcta y se debe elegir la calificación para la Solución 2. Esta es una actualización autoconsistente de la previa del maestro sobre las tres posibles marcas, es decir, si la Solución 2 se fija como la marca correcta el 100% del tiempo, entonces el 25% sigue siendo la única respuesta correcta.(50+25+0)/3=25
Resumen: si especificamos que solo hay una respuesta correcta, entonces esa respuesta es 25%.
fuente
Creo que la respuesta es 1/3. No sabemos qué respuesta (25%, 50% o 60%) es correcta. Entonces, cada respuesta, 25%, 50% y 60% tiene una probabilidad de 1/3 de ser correcta si se selecciona. Aunque el 25% aparece dos veces, todavía tiene una probabilidad de 1/3 de ser la respuesta correcta. En realidad, no importa cuántas veces aparezca el 25% como respuesta. Si aparece 10 veces junto con el 50% y el 60%, la probabilidad de que sea la respuesta correcta seguiría siendo 1/3. Esto supone que una de las respuestas es correcta. Si existe la posibilidad de que ninguna de las respuestas sea correcta, entonces la respuesta sería 1/4. Esto se basa en mi interpretación de lo que hace la pregunta.
fuente