Inicialmente, esto surgió en relación con el trabajo que estamos haciendo con un modelo para clasificar el texto natural, pero lo he simplificado ... Quizás demasiado.
Tienes un auto azul (por alguna medida científica objetiva, es azul).
Se lo muestras a 1000 personas.
900 dicen que es azul. 100 no lo hacen.
Usted le da esta información a alguien que no puede ver el automóvil. Todo lo que saben es que 900 personas dijeron que era azul y 100 no. No sabes nada más sobre estas personas (las 1000).
En base a esto, le preguntas a la persona: "¿Cuál es la probabilidad de que el auto sea azul?"
¡Esto ha causado una gran divergencia de opiniones entre los que he preguntado! ¿Cuál es la respuesta correcta, si hay una?
probability
Pat Molloy
fuente
fuente
Respuestas:
TL; DR: A menos que asuma que las personas son irrazonablemente malas para juzgar el color del automóvil, o que los automóviles azules son irrazonablemente raros, la gran cantidad de personas en su ejemplo significa que la probabilidad de que el automóvil sea azul es básicamente del 100%.
Matthew Drury ya dio la respuesta correcta, pero me gustaría agregar a eso con algunos ejemplos numéricos, porque elegiste tus números de modo que realmente obtengas respuestas bastante similares para una amplia gama de configuraciones de parámetros diferentes. Por ejemplo, supongamos, como dijiste en uno de tus comentarios, que la probabilidad de que las personas juzguen correctamente el color de un automóvil es 0.9. Es decir: y también p ( digamos que no es azul | el automóvil no es azul ) = 0.9
Una vez definido eso, lo que tenemos que decidir es: ¿cuál es la probabilidad previa de que el automóvil sea azul? Elija una probabilidad muy baja solo para ver qué sucede y digamos que , es decir, solo el 0.1% de todos los autos son azules. Entonces, la probabilidad posterior de que el automóvil sea azul se puede calcular como:p(car is blue)=0.001
Si observa el denominador, está bastante claro que el segundo término en esa suma será insignificante, ya que el tamaño relativo de los términos en la suma está dominado por la relación de a 0.1 900 , que es del orden de 10 58 . Y, de hecho, si hace este cálculo en una computadora (teniendo cuidado de evitar problemas de flujo inferior numérico) obtendrá una respuesta igual a 1 (dentro de la precisión de la máquina).0.9900 0.1900 1058
La razón por la cual las probabilidades anteriores realmente no importan mucho aquí es porque tienes mucha evidencia de una posibilidad (el auto es azul) versus otra. Esto se puede cuantificar por la razón de probabilidad , que podemos calcular como:
Entonces, incluso antes de considerar las probabilidades anteriores, la evidencia sugiere que una opción ya es astronómicamente más probable que la otra, y para que la anterior haga alguna diferencia, los autos azules tendrían que ser irrazonablemente, estúpidamente raros (tan raros que esperaríamos encuentra 0 autos azules en la tierra).
Entonces, ¿qué pasa si cambiamos la precisión de las personas en sus descripciones del color del automóvil? Por supuesto, podríamos llevar esto al extremo y decir que lo hacen bien solo el 50% del tiempo, lo cual no es mejor que lanzar una moneda. En este caso, la probabilidad posterior de que el automóvil sea azul es simplemente igual a la probabilidad anterior, porque las respuestas de la gente no nos dijeron nada. Pero seguramente las personas lo hacen al menos un poco mejor que eso, e incluso si decimos que las personas son precisas solo el 51% del tiempo, la razón de probabilidad aún funciona de tal manera que es aproximadamente veces más probable que el automóvil sea azul .1013
Todo esto es el resultado de los números bastante grandes que eligió en su ejemplo. Si hubieran sido 9/10 personas diciendo que el auto era azul, habría sido una historia muy diferente, a pesar de que la misma proporción de personas estaba en un campamento versus el otro. Porque la evidencia estadística no depende de esta relación, sino más bien de la diferencia numérica entre las facciones opuestas. De hecho, en la razón de probabilidad (que cuantifica la evidencia), las 100 personas que dicen que el automóvil no es azul cancelan exactamente 100 de las 900 personas que dicen que es azul, por lo que es lo mismo que si 800 personas estuvieran de acuerdo era azul Y eso es obviamente una evidencia bastante clara.
(Editar: como Silverfish señaló , las suposiciones que hice aquí en realidad implicaban que cada vez que una persona describe incorrectamente un automóvil que no es azul, por defecto dice que es azul. Esto no es realista, por supuesto, porque realmente podría decir cualquier color , y diré azul solo algunas veces. Sin embargo, esto no hace ninguna diferencia en las conclusiones, ya que cuanto menos probable es que las personas confundan un automóvil que no es azul con uno azul, mayor es la evidencia de que es azul cuando lo dicen Es así que, en todo caso, los números dados anteriormente son en realidad solo un límite inferior en la evidencia pro-azul).
fuente
La respuesta correcta depende de la información no especificada en el problema, tendrá que hacer algunas suposiciones más para derivar una respuesta única y definitiva:
Con estos datos, podemos desglosar todo con la fórmula de Bayes para obtener una probabilidad posterior de que el automóvil sea azul. Me centraré en el caso en el que solo le preguntamos a una persona, pero el mismo razonamiento se puede aplicar al caso en el que usted pregunta a personas.1000
Necesitamos continuar desglosando aún más , aquí es donde entra lo anterior:P(say is blue)
Entonces, dos aplicaciones de la regla de Bayes lo llevan allí. Deberá determinar los parámetros no especificados en función de la información que tenga sobre la situación específica o de hacer algunas suposiciones razonables.
Hay algunas otras combinaciones de los supuestos que puede hacer, en función de:
Al principio, no sabes ninguna de estas cosas. Por lo tanto, debe hacer algunas suposiciones razonables sobre tres de ellas, y luego la cuarta se determina a partir de ahí.
fuente
Hay una suposición importante de que sus 1000 opiniones no comparten un sesgo sistemático. Lo cual es una suposición razonable aquí, pero podría ser importante en otros casos.
Los ejemplos pueden ser:
No es probable en este caso, pero es una suposición implícita significativa en otros casos. Tampoco tiene que ser tan extremo: transponga su pregunta a otro dominio y esto será un factor real.
Ejemplos para cada uno donde su respuesta puede verse afectada por un sesgo compartido:
No sería difícil imaginar algunas preguntas estructuralmente idénticas donde la respuesta 900: 100 fue una medida de creencias y honestidad, o algo más, y no apunta a la respuesta correcta. No es probable en este caso, pero en otros casos, sí.
fuente
Una razón por la que obtiene diferentes respuestas de diferentes personas es que la pregunta se puede interpretar de diferentes maneras, y no está claro qué quiere decir con "probabilidad" aquí. Una forma de dar sentido a la pregunta es asignar antecedentes y razones usando la regla de Bayes como en la respuesta de Matthew.
Antes de pedir probabilidades, debe decidir qué se modela como aleatorio y qué no. No se acepta universalmente que se asignen cantidades desconocidas pero fijas antes. Aquí hay un experimento similar al suyo que resalta el problema con la pregunta:
fuente
the probability is either one or zero, depending on whether the car is actually blue or not.
esto no corresponde a una comprensión de la "probabilidad", ya que estoy familiarizado con ella. Suena un poco como "X puede suceder o no puede suceder, por lo que la probabilidad debe ser del 50%". ¿Puedes aclarar un poco más lo que quieres decir con esa oración?Respuesta práctica simple:
La probabilidad puede variar fácilmente de 0% a 100% dependiendo de sus suposiciones
Aunque realmente me gustan las respuestas existentes, en la práctica básicamente se reduce a estos dos escenarios simples:
Escenario 1: se supone que las personas son muy buenas para reconocer el azul cuando es azul ... 0%
En este caso, hay tantas personas que afirman que el automóvil no es azul, que es muy poco probable que el automóvil sea realmente azul. Por lo tanto, la probabilidad se acerca al 0%.
Escenario 2: se supone que las personas son muy buenas para reconocer no azul cuando no es azul ... 100%
En este caso, hay tantas personas que afirman que el automóvil es azul, que es muy probable que sea azul. Por lo tanto, la probabilidad se acerca al 100%.
Por supuesto, llegando a esto desde un ángulo matemático, comenzaría por algo genérico como 'supongamos que las probabilidades relevantes son ...', lo que no tiene sentido ya que tales cosas generalmente no se conocen por ninguna circunstancia aleatoria. Por lo tanto, abogo por mirar los extremos para comprender la idea de que ambos porcentajes pueden justificarse fácilmente con suposiciones simples y realistas, y que, por lo tanto, no hay una respuesta única y significativa.
fuente
Necesita desarrollar un marco de estimación. Algunas preguntas que puede hacer son
Cuantos colores hay? ¿Estamos hablando de dos colores? O todos los colores del arcoiris?
¿Qué tan distintos son los colores? ¿Estamos hablando de azul y naranja? ¿O azul, cian y turquesa?
¿Qué significa ser azul? ¿Son cian y / o azul turquesa? ¿O simplemente azul en sí mismo?
¿Qué tan buenas son estas personas para estimar el color? ¿Son todos diseñadores gráficos? ¿O son daltónicos?
Desde un punto de vista puramente estadístico, podemos hacer algunas conjeturas sobre el último. Primero, sabemos que al menos el 10% de las personas están eligiendo una respuesta incorrecta. Si solo hay dos colores (de la primera pregunta), entonces podríamos decir que hay
Como una comprobación rápida, si sumamos esos, obtenemos el 100%. Puede ver una notación más matemática de esto en la respuesta @MatthewDrury .
¿Cómo conseguimos el 90% en el tercero? Es la cantidad de personas que dijeron azul pero se equivocaron si no es así. Debido a que solo hay dos colores, estos son simétricos. Si hubiera más de dos colores, entonces la posibilidad de que la elección incorrecta fuera azul cuando decían algo más sería menor.
De todos modos, este método de estimación nos da 90% de azul. Esto incluye un 81% de posibilidades de que las personas digan azul cuando es así y un 9% de probabilidades de que las personas digan que no es así. Esto es probablemente lo más cerca que podemos llegar a responder la pregunta original, y requiere que confiemos en los datos para estimar dos cosas diferentes. Y asumir que la probabilidad de que se elija el azul es la misma que la probabilidad de que el azul sea correcto.
Si hay más de dos colores, entonces la lógica va a cambiar un poco. Las primeras dos líneas permanecen igual, pero perdemos la simetría en las últimas dos líneas. En ese caso, necesitamos más información. Es posible que podamos estimar nuevamente la probabilidad de decir correctamente el azul como 81%, pero no tenemos idea de cuáles son las posibilidades de que el color sea azul cuando alguien dice que no lo es.
También podríamos mejorar incluso la estimación de dos colores. Dado un número estadísticamente significativo de automóviles de cada color, podríamos tener un número estadísticamente significativo de personas que los vean y los clasifiquen. Luego podríamos contar con qué frecuencia las personas tienen razón cuando hacen cada elección de color y con qué frecuencia son correctas para cada elección de color. Entonces podríamos estimar con mayor precisión dadas las elecciones reales de las personas.
Puede preguntar cómo 90% podría estar equivocado. Considere lo que sucede si hay tres colores: azul, azul y zafiro. Alguien podría considerar razonablemente que estos tres son azules. Pero queremos más. Queremos el tono exacto. ¿Pero quién recuerda los nombres de los otros tonos? Muchos pueden adivinar el azul porque es el único tono coincidente que conocen. Y aún así estar equivocado cuando resulta ser azul.
fuente
Un exacta, matemática, verdadero / falso probabilidad no se puede calcular con la información que proporcione.
Sin embargo, en la vida real, dicha información nunca está disponible con certeza. Por lo tanto, usando nuestra intuición (y dónde iría todo mi dinero si apostamos), el auto es definitivamente azul. (algunos creen que esto ya no son estadísticas, pero bueno, las vistas en blanco y negro de la ciencia no son muy útiles)
El razonamiento es simple. Suponga que el auto no es azul. Entonces el 90% de las personas (!) Se equivocaron. Solo podrían estar equivocados debido a una lista de problemas que incluye:
Dado que lo anterior claramente no es probable que afecte al 90% de una población aleatoria promedio (por ejemplo, el daltonismo afecta a alrededor del 8% de los hombres y el 0.6% de las mujeres, es decir, 43 de cada 1000), es necesariamente el caso de que el automóvil esté azul. (Eso es donde todo mi dinero iría de todos modos).
fuente
No comería heces por el hecho de que miles de millones de moscas no pueden estar equivocadas. Podría haber docenas de otras razones por las cuales 900 personas de cada 1000 podrían haber sido engañadas para pensar que el automóvil es azul. Después de todo, esa es la base de los trucos mágicos, que atraen a las personas a pensar que algo está alejado de la realidad. Si 900 de cada 1000 personas ven a un mago apuñalando a su asistente, responderán rápidamente si el asistente fue apuñalado, por lo improbable que ocurrió un homicidio en el escenario. Una luz azul en la pintura reflectante de un auto, ¿alguien?
fuente
El encuestado sabe muy poco acerca de cómo se realizó la encuesta para responder la pregunta con precisión. En lo que a él respecta, la encuesta puede sufrir varios problemas:
Las personas que participaron en la encuesta podrían haber sido parciales:
El auto se veía azul debido a una ilusión óptica .
Por alguna razón, el color del automóvil era difícil de observar, y por alguna razón a la gente se le habían mostrado muchos automóviles azules antes de este, lo que hizo que la mayoría de ellos creyeran que este automóvil probablemente también era azul.
Les habías pagado para decir que el auto es azul.
Hiciste que alguien los hipnotizara para que creyeran que el auto es azul.
Habían hecho un pacto para mentir y sabotear la encuesta.
Puede haber habido correlaciones entre las personas que respondieron la encuesta debido a cómo fueron seleccionadas o porque se afectaron entre sí:
Accidentalmente realizó la encuesta en una reunión masiva para personas con el mismo tipo de daltonismo.
Realizaste la encuesta en jardines de infancia; Las chicas no estaban interesadas en el automóvil y la mayoría de los chicos tenían el azul como su color favorito, lo que les hacía imaginar que el automóvil era azul.
La primera persona a quien se le mostró el auto estaba borracho y pensó que se veía azul, gritó "ES AZUL", haciendo que todos los demás pensaran que el auto era azul.
Entonces, si bien la probabilidad de que el automóvil sea azul si la encuesta se realizó de manera completamente correcta es extremadamente alta (como se explica en la respuesta de Ruben van Bergen), la confiabilidad de la encuesta puede haberse visto comprometida, lo que hace que la posibilidad de que el automóvil no sea azul no insignificante. Lo grande que el encuestado estima que esta oportunidad depende en última instancia de sus estimaciones de cuán probable es que las circunstancias se hayan equivocado con la encuesta y de qué tan bueno es para llevar a cabo encuestas (y cuán travieso cree que es).
fuente
¿Cuál es la definición de "azul"?
Diferentes culturas e idiomas tienen diferentes nociones de azul. IIRC, ¡algunas culturas incluyen el verde dentro de su noción de azul!
Al igual que cualquier palabra de lenguaje natural, solo puede suponer que hay alguna convención cultural sobre cuándo (y cuándo no) llamar a las cosas "azules".
En general, el color en el lenguaje es sorprendentemente subjetivo (enlace de los comentarios a continuación, gracias @Count Ibilis)
fuente
La probabilidad podría, dependiendo de condiciones previas más refinadas, ser varios valores diferentes, pero 99.995% es el que tiene más sentido para mí.
Sabemos, por definición, que el automóvil es azul (eso es 100%), pero no está bien especificado lo que esto realmente significa (eso apostaría algo filosófico). Asumiré que algo es azul en el sentido de que puede ser visto como azul.
También sabemos que el 90% de los sujetos de prueba lo informaron como azul.
Nosotros no sabemos lo que se solicitó o cómo se realizó la evaluación, y qué condiciones de iluminación del automóvil se encontraba. Cuando se le preguntó a nombrar el color, algunos sujetos puede ser que por ejemplo han dicho "verde-azul" debido a las condiciones de iluminación, y el evaluador podría no haber contado eso como "azul". Las mismas personas podrían haber respondido "sí" si la pregunta hubiera sido "¿Es esto azul?". Asumiré que no tenía la intención de engañar maliciosamente a los sujetos de prueba.
Sabemos que la incidencia de la tritanopía es de aproximadamente el 0,005%, lo que significa que si el automóvil realmente puede verse como azul , entonces el 99,995% de los sujetos de prueba sí vieron el color como azul. Sin embargo, eso significa que el 9.995% de los sujetos de prueba no informaron azul cuando claramente vieron azul. Estaban mintiendo sobre lo que vieron. Esto está cerca de lo que su experiencia de vida también le dice: las personas no siempre son honestas (pero, a menos que haya un motivo, generalmente lo son).
Por lo tanto, la persona que no observa puede asumir con certeza abrumadora que el automóvil es azul. Eso sería 100%
Excepto ... excepto si la persona que no observa sufre de tritanopía, en cuyo caso no vería el auto como azul a pesar de que todos los demás (o más bien, el 90% de ellos) lo dicen. Aquí se vuelve filosófico otra vez: si todos los demás escucharon la caída de un árbol, pero yo no, ¿se cayó?
Me atrevo a decir que la respuesta más razonable y práctica sería: si la persona que no observa es un trianope (0.005% de probabilidad), entonces verificar si el color predicho y el color real tal como se ven serían falsos. Por lo tanto, la probabilidad es del 99.995% en lugar del 100%.
Además, como beneficio adicional, dado que descubrimos que el 9.995% de los sujetos de prueba son mentirosos, y se sabe que todos los cretenses son mentirosos , ¡podemos concluir que no estamos en Creta!
fuente
Es 100% azul.
El uso de estos números (sin ningún contexto) es completamente absurdo. Todo se reduce a la interpretación personal de la pregunta. No debemos seguir este camino y usar Wittgenstein: "Wovon man nicht sprechen kann, darüber muss man schweigen".
Imagine la siguiente pregunta para comparar:
Este es básicamente el mismo problema (sin información), pero está mucho más claro que lo que pensamos del color del automóvil es en su mayoría (si no completamente) circunstancial.
A la larga, cuando recibimos múltiples preguntas asociadas, podemos comenzar a adivinar respuestas a preguntas tan incompletas. Esto es lo mismo para el algoritmo de ojo por ojo que no funciona para un solo caso, pero funciona a largo plazo . En el mismo sentido, Wittgenstein regresó de su trabajo anterior con sus Investigaciones principales . Podemos responder estas preguntas, pero necesitamos más información / ensayos / preguntas. Es un proceso.
fuente
Si suponemos que el automóvil es azul, entonces 100 de cada 1,000 que dicen que no es azul implica un sesgo de muestra extremo de algún tipo. Tal vez estabas probando solo personas daltónicas. Si suponemos que el automóvil no es azul, entonces el sesgo de la muestra es aún peor. Entonces, todo lo que podemos concluir de los datos proporcionados es que la muestra es muy sesgada, y dado que no sabemos cómo fue sesgada, no podemos concluir nada sobre el color del automóvil.
fuente
Ha habido algunas respuestas. De ninguna manera soy un gurú de las matemáticas, pero bueno, aquí está el mío.
Solo puede haber 4 posibilidades:
De la pregunta, usted sabe que la suma del caso 1 y el caso 4 es de 900 personas (90%), y la suma del caso 2 y el caso 3 es de 100 personas (10%). Sin embargo, aquí está el truco: lo que no sabe es la distribución dentro de estos 2 pares de casos. Tal vez la suma de los casos 1 y 4 esté completamente compuesta por el caso 1 (lo que significa que el automóvil es azul), o tal vez la suma total esté compuesta por el caso 4 (lo que significa que el automóvil no es azul). Lo mismo ocurre con la suma del caso 2 + 3. Entonces ... Lo que necesita es encontrar alguna forma de predecir la distribución dentro de las sumas de casos. Sin ninguna otra indicación en la pregunta (en ninguna parte dice que las personas están 80% seguras de saber sus colores o algo así) no hay forma de que pueda dar una respuesta segura y definitiva.
Dicho esto ... sospecho que la respuesta esperada es algo similar a:
donde el 50% restante es simplemente desconocido, llámelo margen de error.
fuente
fuente
La persona que no puede ver el automóvil no sabe que está científicamente comprobado que es azul. La probabilidad de que el auto sea azul es 50/50 (es azul o no lo es). Las encuestas a otras personas pueden influir en la opinión de esta persona, pero no cambia la probabilidad de que un automóvil invisible sea azul o no.
Todas las matemáticas anteriores determinan la probabilidad de que su conjunto de muestras pueda determinar si es azul.
fuente