¿Cuál será la respuesta correcta si modificamos la "Mejor pregunta de estadística"?

8

Hay una pregunta popular, llamada "La mejor pregunta de estadística".

Si elige una respuesta a esta pregunta al azar, ¿cuál es la probabilidad de que esté en lo correcto?

A) 25% B) 50% C) 60% D) 25%

Esta tarea no es muy difícil, la respuesta correcta es 0%. Pero si lo modificamos así:

Si elige una respuesta a esta pregunta al azar, ¿cuál es la probabilidad de que esté en lo correcto?

A) 50% B) 25% C) 60% D) 50%

¿Cuál será la respuesta correcta? ¿Tenemos dos respuestas correctas: 25% y 50%, o no hay una respuesta correcta, ya que con estas dos respuestas correctas, la posibilidad de elegir la respuesta correcta es de hecho el 75% (pero no tenemos el 75% escrito en el escritorio) )?

Por cierto. ¿La respuesta 0% sigue siendo la respuesta correcta, la tercera respuesta correcta en este caso?

Mella
fuente
1
La respuesta, por supuesto, depende de cómo se haga la elección aleatoria. "Al azar" no siempre significa "uniformemente al azar" ...;)
MånsT
Supongamos "uniformemente al azar". La lógica detrás de la pregunta original era: como respuesta, el 25% tiene un 50% de probabilidad de ser elegido, y las respuestas un 50% y un 60% tienen un 25% de probabilidad de ser elegido, estas respuestas no son correctas. La respuesta 0% es correcta, ya que la probabilidad de elegirla es 0%.
Nick
2
Este problema se analizó exhaustivamente en matemáticas.
cardenal
44
@whuber: Aquí está el que tiene más votos . Hubo otros, pero tal vez se cerraron / fusionaron.
cardenal
2
@ Cardenal Gracias. Supongo que me alegra ver que parece que no hay respuestas profundas o esclarecedoras (a pesar de la fuerte votación), porque significa que puede haber algún margen para más exégesis aquí :-).
whuber

Respuestas:

11

Las paradojas aparentes (de lógica o probabilidad) pueden resolverse enmarcando las preguntas de manera clara y cuidadosa.

El siguiente análisis está motivado por la idea de defender una respuesta: cuando un examinado puede exhibir un posible estado de cosas (consistente con toda la información disponible) en el que su respuesta es correcta, entonces debe marcarse como correcta. De manera equivalente, una respuesta es incorrecta cuando no existe tal defensa; se considera correcto de lo contrario. Esto modela las interacciones habituales entre calificadores (benevolentes, racionales) y examinadores (racionales) :-). La aparente paradoja se resuelve exhibiendo múltiples defensas para la segunda pregunta, solo una de las cuales podría aplicarse en cualquier caso.


Tomaré el significado de "aleatorio" en estas preguntas en un sentido convencional: para modelar una elección aleatoria de respuesta, escribiré cada respuesta en un trozo de papel ("ticket") y la pondré en un recuadro: eso será Cuatro entradas en total. Sacar un boleto de la caja (después de barajar cuidadosamente y ciegamente el contenido de la caja) es un modelo físico para una elección "aleatoria". Motiva y justifica un modelo de probabilidad correspondiente .

Ahora, ¿qué significa "ser correcto"? En mi ignorancia, exploraré todas las posibilidades. En cualquier caso, considero definitivo que cero, uno o incluso más boletos pueden ser "correctos". (¿Cómo podría saberlo? ¡Simplemente consulto la hoja de calificación!) Marcaré las respuestas "correctas" como tales escribiendo el valor en cada boleto correcto y escribiendo en las demás. Eso es rutina y no debería ser controvertido.10

Una cosa obvia pero importante a tener en cuenta es que la regla para escribir o debe basarse únicamente en la respuesta escrita en cada ticket: matemáticamente, es un mapeo (o reasignación) que envía el conjunto de respuestas enumeradas ( en ambas preguntas) en el conjunto . Esta regla es necesaria para la autoconsistencia.01{.25,.50,.60}{0,1}

Pasemos al elemento probabilístico de la pregunta: por definición, la posibilidad de ser correcta, bajo un sorteo aleatorio de tickets, es la expectativa de los valores con los que se han marcado. La expectativa se calcula sumando los valores en los tickets y dividiéndolos por su número total. Por lo tanto, será , , , o .0.25.50.751

Una marca tendrá sentido siempre que solo los tickets cuyas respuestas sean iguales a la expectativa estén marcados con s1 . Este también es un requisito de autoconsistencia. Afirmo que este es el quid de la cuestión: encontrar e interpretar las marcas que tienen sentido. Si no hay ninguno, entonces la pregunta en sí misma puede ser calificada como sin sentido. Si hay una marca única, entonces no habrá controversia. Solo si dos o más marcas tienen sentido, habrá alguna dificultad potencial.

¿Qué marcas tienen sentido?

Ni siquiera necesitamos hacer una búsqueda exhaustiva. En la primera pregunta , las expectativas enumeradas en los boletos son del 25%, 50% y 60%. Esto último es imposible con cuatro boletos. El primero requeriría exactamente un boleto para ser marcado; el segundo, dos entradas. Eso da como máximo posibles marcas para explorar. La única marca que tiene sentido pone s en cada ticket. Para esta marca, la expectativa es . Eso justifica la respuesta declarada a la primera pregunta. (¡Podría decirse que la única respuesta correcta a la primera pregunta es no seleccionar ninguna respuesta!)3+3=60(0+0+0+0)/4=0

En la segunda pregunta , aparecen las mismas respuestas y una vez más hay seis marcas para explorar. Esta vez, tres marcas son autoconsistentes. Los tabulo:

Solution 1                Solution 2                Solution 3
Ticket Answer Mark        Ticket Answer Mark        Ticket Answer Mark
     A    50%    1             A    50%    0             A    50%    0
     B    25%    0             B    25%    1             B    25%    0
     C    60%    0             C    60%    0             C    60%    0
     D    50%    1             D    50%    0             D    50%    0

Por lo tanto, hay tres posibles definiciones distintas de "correcto" en el segundo problema, lo que lleva a que A o D sean correctas (en la solución 1) o que solo B sea correcta (en la solución 2), o que ninguna de las respuestas sea correcta (en solución 3).

Una forma de interpretar este estado de cosas es que para cada una de las respuestas A, B y D, existe al menos una forma de marcar los tickets que hace que esas respuestas sean correctas. Esto no implica que los tres sean simultáneamente correctos: no podrían serlo, porque . Si usted fuera el calificador de la prueba, entonces si marcó correctamente A, B o D, entonces no obtendría un argumento del examinado; pero si marcó alguno de ellos incorrecto,.25.50 el examinado tendrá una base legítima para disputar su puntaje: invocará la solución 1 o la solución 2. De hecho, si un examinado se niega a responder la pregunta, la solución 3 le dará una base legítima para argumentar que no ¡La respuesta también debería obtener crédito completo!

En resumen, este análisis aborda la segunda parte de la pregunta al concluir que cualquiera de las siguientes respuestas a la pregunta 2 debe marcarse como correcta porque cada una de ellas es defendible : A, B, D, A y D, y nada. No se puede defender ninguna otra respuesta y, por lo tanto, no sería correcta.

whuber
fuente
1
Entonces, ¿cuál es su respuesta a la pregunta 2? Parece que has dado una explicación inmensamente complicada con tres posibles respuestas consistentes. Todavía mantengo que esto indica un problema con la definición de correcto.
Michael R. Chernick
2
@Michael Gracias: he agregado un párrafo para dejar las conclusiones perfectamente claras. Admitiré haber elaborado una respuesta relativamente larga (que tal vez esté justificada por la mayor longitud colectiva de respuestas aquí y en el sitio de matemáticas). "Inmensamente complicado" debe estar en el ojo del espectador: he trabajado para hacer que las ideas sean lo más sencillas posible para que los lectores puedan comprobar fácilmente que no estoy tratando de engañarlas. Cuando otros afirman que hay una "paradoja" o una "pregunta en la lógica", es esencial ser simple, claro y explícito, aunque hacerlo puede aumentar la duración.
whuber
1
@Michael lo aprecio. Yo mismo estoy un poco indeciso sobre esta resolución, porque las personas no se sienten cómodas con la idea de que puede haber múltiples respuestas correctas para preguntas simples y claras. Invito a la evaluación crítica de esta idea de "defendibilidad" como una forma de evitar la aparente paradoja. Para mí, parece una forma original de eludir las conclusiones negativas alcanzadas por otros (a saber, que la segunda pregunta no tiene sentido, tiene sentido o es ilógica). El principal valor de examinar las paradojas radica en alentar un examen más profundo de las ideas fundamentales.
whuber
1
Ah, ese es el punto, @Michael: aunque los tres son contradictorios, cada uno es defendible. Proporcioné la defensa en la explicación que condujo a las soluciones tabuladas. Seamos prácticos aquí: imagina que eres un maestro en una institución de la Ivy League (donde los estudiantes y sus padres, desafortunadamente, se han vuelto bastante litigiosos en los últimos años) y has hecho esas preguntas como parte de un examen. ¿Cómo los calificas? Mi análisis sugiere una forma racional, objetiva, justa y que evita la discusión entre profesor y alumno, ¡aunque los alumnos pueden diferir entre ellos!
whuber
2
Ahí está tu problema, @Michael: la suposición de que debe haber una respuesta única a una pregunta de opción múltiple. (Hable con los médicos que conoce y pregúnteles sobre las preguntas de opción múltiple en sus exámenes de certificación de la junta: al menos en el pasado, varias respuestas a cada pregunta serían correctas). Aquí, la presencia de dos respuestas idénticas a la segunda pregunta indica la posibilidad de que más de una respuesta a una pregunta pueda considerarse correcta. // En este punto, parece que corremos el riesgo de desviarnos del problema, por lo que si tiene más comentarios, inicie una sala de chat.
whuber
9

Creo que hay un problema de semántica aquí además de la probabilidad. Elegir al azar es claro. Cada uno de A, B, C y D se seleccionará un 25%. Pero, ¿qué significa ser correcto cuando escoges al azar? Parece que debería significar dado que elige A does As answer da el% correcto de muestras que serán correctas y lo mismo para B, C y D. Por lo tanto, debe contar 1/4 para cada respuesta correcta y sumar todas las respuestas correctas para obtener el porcentaje correcto. Pero esto lleva a un argumento circular. De ahí la paradoja. Esto realmente parece ser una cuestión de lógica más que de probabilidad o estadística.

Michael R. Chernick
fuente
1
+1. Me preguntaba "¿Pero qué significa ser correcto ...?". Estoy de acuerdo en que esto parece ser más un enigma lógico que una pregunta de probabilidad (aunque me gustaría escuchar una explicación de alguien sobre por qué esta percepción es incorrecta).
Macro
La lógica detrás de la pregunta original era tal como la describiste. Como una respuesta del 25% tiene un 50% de probabilidad de ser elegido, y una respuesta del 50% y un 60% tiene un 25% de probabilidad de ser elegido, estas respuestas no son correctas. La respuesta 0% es correcta, ya que la probabilidad de elegirla es 0%. Esto recuerda un argumento circular, pero ¿esto hace que la pregunta sea incorrecta?
Nick
@ Nick, no lo creo. Creo que el argumento circular lo hace indeterminado. No puede decir qué respuestas son correctas y no puede decir qué respuestas son incorrectas. Entonces 0% no es la respuesta. La pregunta no puede ser respondida. Quizás pueda decir que el 60% es incorrecto porque si hubiera una respuesta tendría que ser un múltiplo de 1/4.
Michael R. Chernick
1

whuber ofrece un excelente análisis donde se permiten múltiples respuestas. Sin embargo, también hay una manera consistente de entender la pregunta de tal manera que solo haya una respuesta correcta (aunque necesitamos decir esto como parte de la pregunta):

Si elige una respuesta a esta pregunta al azar, ¿cuál es la probabilidad de que sea correcta, dado que solo hay una respuesta correcta?

A) 50% B) 25% C) 60% D) 50%

Nuevamente, definiremos una respuesta "correcta" como una que sea racionalmente defendible y siga el argumento de whuber. Una marca es un mapa del conjunto de respuestas a modo que las respuestas correctas se envían a 1 y las respuestas incorrectas a 0. Hay tres posibles marcas autoconsistentes:{0,1}

Solution 1                Solution 2                Solution 3
Ticket Answer Mark        Ticket Answer Mark        Ticket Answer Mark
     A    50%    1             A    50%    0             A    50%    0
     B    25%    0             B    25%    1             B    25%    0
     C    60%    0             C    60%    0             C    60%    0
     D    50%    1             D    50%    0             D    50%    0

Sin embargo, necesitamos otro paso lógico para reducirlos a una sola respuesta defendible. Al resolver este problema, el maestro se enfrentó a tres posibles marcas, cada una de las cuales podría ser una respuesta única tan aceptable como las otras. Sin embargo, como solo una respuesta puede ser correcta, el maestro debe elegir al azar entre ellos. Esto asigna una probabilidad igual a cada marca para que:

  • 1/3 de las veces el estudiante tendrá razón el de las veces50%
  • 1/3 de las veces el estudiante tendrá razón el de las veces25%
  • 1/3 de las veces el alumno tendrá razón de las veces0%

Esto da como resultado la expectativa de que el estudiante tendrá razón % del tiempo. Por lo tanto, el 25% debe ser la respuesta correcta y se debe elegir la calificación para la Solución 2. Esta es una actualización autoconsistente de la previa del maestro sobre las tres posibles marcas, es decir, si la Solución 2 se fija como la marca correcta el 100% del tiempo, entonces el 25% sigue siendo la única respuesta correcta.(50+25+0)/3=25

Resumen: si especificamos que solo hay una respuesta correcta, entonces esa respuesta es 25%.

WJ Zeng
fuente
¿Podría explicar la justificación de "Sin embargo, como solo una respuesta puede ser correcta, el maestro debería elegir al azar entre ellos"? No veo por qué se requiere una elección aleatoria en este momento.
whuber
Por supuesto, es posible que el maestro pueda tener algún tipo de sesgo, pero no hay razón para pensar que existe uno. En ausencia total de cualquier otra información, creo que lo racional antes de asumir es que la elección sigue una distribución uniforme. Avísame si esto parece equivocado.
WJ Zeng
No sé si está equivocado o no, pero llamarlo "el racional previo" no parece una explicación en absoluto. Lo que me molesta es que "especificar que solo hay una respuesta correcta" podría ser intrínsecamente contradictorio, en cuyo caso ninguna distribución previa será relevante. Además, el esquema lógico de su argumento parece ser "si suponemos que hay una única respuesta correcta y también adoptamos una distribución previa entre las tres posibles respuestas correctas, entonces concluimos que hay una única respuesta correcta". Eso parece terriblemente circular, pero tal vez podría arreglarse.
whuber
0

Creo que la respuesta es 1/3. No sabemos qué respuesta (25%, 50% o 60%) es correcta. Entonces, cada respuesta, 25%, 50% y 60% tiene una probabilidad de 1/3 de ser correcta si se selecciona. Aunque el 25% aparece dos veces, todavía tiene una probabilidad de 1/3 de ser la respuesta correcta. En realidad, no importa cuántas veces aparezca el 25% como respuesta. Si aparece 10 veces junto con el 50% y el 60%, la probabilidad de que sea la respuesta correcta seguiría siendo 1/3. Esto supone que una de las respuestas es correcta. Si existe la posibilidad de que ninguna de las respuestas sea correcta, entonces la respuesta sería 1/4. Esto se basa en mi interpretación de lo que hace la pregunta.

Jamie
fuente
1
Este intento de explicación falla porque combina inválidamente la ignorancia (no sabemos cuál de las tres respuestas sería correcta) con probabilidad (asignando 1/3 a cada respuesta).
whuber