¿Cuál es la probabilidad de que esta persona sea mujer?

32

Hay una persona detrás de una cortina; no sé si la persona es hombre o mujer.

Sé que la persona tiene cabello largo y que el 90% de todas las personas con cabello largo son mujeres

Sé que la persona tiene un tipo sanguíneo raro AX3, y que el 80% de todas las personas con este tipo de sangre son mujeres.

¿Cuál es la probabilidad de que la persona sea mujer?

NOTA: esta formulación original se ha ampliado con dos supuestos adicionales: 1. El tipo de sangre y la longitud del cabello son independientes 2. La proporción hombre: mujer en la población en general es 50:50

(El escenario específico aquí no es tan relevante; más bien, tengo un proyecto urgente que requiere pensar en el enfoque correcto para responder esto. Mi intuición es que es una cuestión de probabilidad simple, con una respuesta definitiva simple, más bien que algo con múltiples respuestas discutibles según diferentes teorías estadísticas).

Probablemente equivocado
fuente
1
No existen múltiples teorías de probabilidad, pero es notoriamente cierto que las personas tienen dificultades para pensar correctamente sobre las probabilidades. (Augustus DeMorgan, un buen matemático, abandonó el estudio de la probabilidad debido a sus dificultades). No mire los debates: busque apelaciones a los principios de probabilidad (como los axiomas de Kolmogorov). No permita que esto se resuelva democráticamente: su pregunta está atrayendo muchas respuestas mal concebidas que, incluso si algunas de ellas están de acuerdo, simplemente están colectivamente equivocadas. @Michael C da una buena orientación; mi respuesta intenta mostrarte por qué tiene razón.
whuber
@Whuber, si se supone la independencia, ¿estaría de acuerdo en que 0.97297 es la respuesta correcta? (Creo que la respuesta podría estar entre 0% y 100% sin esta suposición; sus diagramas lo muestran muy bien).
Probablemente
¿Independencia de qué, precisamente? ¿Estás sugiriendo que los peinados femeninos y masculinos son iguales? Como dices en tu pregunta, este escenario particular que involucra género / cabello / tipo de sangre puede no ser relevante: eso me dice que buscas entender cómo resolver problemas como este en general. Para hacerlo, necesitará saber qué supuestos implican qué conclusiones. Por lo tanto, debe concentrarse con mucho cuidado en los supuestos que está dispuesto a hacer y determinar exactamente cuánto le permiten concluir.
whuber
3
El tipo de independencia para explorar se refiere a la combinación de las tres características. Por ejemplo, si AX3 es un marcador de un síndrome que incluye la calvicie en las mujeres (pero no en los hombres), cualquier persona de cabello largo con AX3 es necesariamente hombre, lo que hace que la probabilidad de ser mujer sea del 0%, no del 97,3%. Espero que esto haga obvio que cualquiera que presente una respuesta definitiva a esta pregunta debe hacer suposiciones adicionales, incluso si no las reconoce explícitamente. Las respuestas verdaderamente útiles, en mi humilde opinión, serían aquellas que muestran directamente cómo diferentes supuestos conducen a diferentes resultados.
whuber
2
Te estás perdiendo la probabilidad de que una mujer no tenga el pelo largo. Esa es una medida crítica.
Daniel R Hicks

Respuestas:

35

A muchas personas les resulta útil pensar en términos de una "población", subgrupos dentro de ella y proporciones (en lugar de probabilidades). Esto se presta al razonamiento visual.

Explicaré las cifras en detalle, pero la intención es que una comparación rápida de las dos figuras indique de manera inmediata y convincente cómo y por qué no se puede dar una respuesta específica a la pregunta. Un examen un poco más largo sugerirá qué información adicional sería útil para determinar una respuesta o al menos obtener límites en las respuestas.

diagrama de Venn

Leyenda

Trama cruzada : hembra / Fondo sólido : macho.

Arriba : pelo largo / Abajo : pelo corto.

Derecha (y coloreada) : AX3 / Izquierda (sin color) : no AX3.

Datos

El sombreado cruzado superior es el 90% del rectángulo superior ("el 90% de todas las personas con cabello largo son mujeres").

El sombreado cruzado total en el rectángulo de color derecho es el 80% de ese rectángulo ("el 80% de todas las personas con este tipo de sangre son mujeres").

Explicación

Este diagrama muestra esquemáticamente cómo la población (de todas las hembras y no hembras bajo consideración) se puede dividir simultáneamente en hembras / no hembras, AX3 / no AX3 y cabello largo / no largo ("corto"). Utiliza el área, al menos aproximadamente, para representar proporciones (hay una exageración para aclarar la imagen).

Es evidente que estas tres clasificaciones binarias crean ocho grupos posibles. Cada grupo aparece aquí.

La información dada indica que el rectángulo superior con trama cruzada (hembras de pelo largo) comprende el 90% del rectángulo superior (todas las personas de pelo largo). También establece que las partes sombreadas combinadas de los rectángulos coloreados (hembras de pelo largo con AX3 y hembras de pelo corto con AX3) comprenden el 80% de la región coloreada a la derecha (todas las personas con AX3). Se nos dice que alguien se encuentra en la esquina superior derecha (flecha): personas de pelo largo con AX3. ¿Qué proporción de este rectángulo está sombreada (hembra)?

También (implícitamente) supuse que el tipo de sangre y la longitud del cabello son independientes : la proporción del rectángulo superior (cabello largo) que está coloreado (AX3) es igual a la proporción del rectángulo inferior (cabello corto) que está coloreado (AX3). Eso es lo que significa independencia. Es una suposición justa y natural cuando se abordan preguntas como esta, pero, por supuesto, es necesario mencionarlo.

Se desconoce la posición del rectángulo sombreado superior (hembras de pelo largo). Podemos imaginarnos deslizando el rectángulo sombreado superior de lado a lado y deslizando el rectángulo sombreado inferior de lado a lado y posiblemente cambiando su ancho. Si hacemos esto para que el 80% del rectángulo coloreado permanezca sombreado, dicha alteración no cambiará ninguna de la información indicada, pero puede alterar la proporción de hembras en el rectángulo superior derecho. Evidentemente, la proporción podría estar entre 0% y 100% y aún ser coherente con la información dada, como en esta imagen:

Figura 2


Una fortaleza de este método es que establece la existencia de múltiples respuestas a la pregunta. Se podría traducir todo esto algebraicamente y, mediante la estipulación de probabilidades, ofrecer situaciones específicas como posibles ejemplos, pero entonces surgiría la pregunta de si tales ejemplos son realmente consistentes con los datos. Por ejemplo, si alguien sugiriera que quizás el 50% de las personas de cabello largo son AX3, al principio no es evidente que esto sea posible dada toda la información disponible. Estos diagramas (de Venn) de la población y sus subgrupos aclaran esas cosas.

whuber
fuente
3
Whuber, suponiendo que el tipo de sangre y la longitud del cabello sean independientes, entonces, ¿seguramente la porción de mujeres de cabello largo con tipo AX3 debería ser la misma que la porción de mujeres de cabello corto con AX3? Es decir, no tiene flexibilidad para cambiar los rectángulos de la manera que propone ... Si suponemos también que los hombres y las mujeres son 50:50 en toda la población, ¿no nos da eso suficiente información para resolver esta pregunta con una sola respuesta indiscutible?
Probablemente
@whuber +1 muy agradable.
Michael R. Chernick
55
Probablemente sea incorrecto, eche un vistazo de cerca a la pregunta en su comentario: porque se trata de mujeres , está haciendo una suposición adicional sobre la independencia condicionada al género. La suposición de la independencia (incondicional) del cabello y el tipo de sangre no menciona el género en absoluto, por lo que para comprender lo que significa, borre el sombreado de las figuras. Esto, espero, indica por qué tenemos la flexibilidad de situar el sombreado cruzado donde queramos dentro de los rectángulos superior e inferior.
whuber
1
@whuber, me gusta esto. Sin embargo, tengo 2 preguntas / aclaraciones: 1. las cifras parecen asumir proporciones de población para cabello largo vs corto (aproximadamente 6: 4) y ~ AX3 vs AX3 (aproximadamente 85:15), pero esto no se menciona en la pregunta original ni discutido en sus explicaciones de las figuras. Sospecho que las proporciones pop no son relevantes. ¿Tengo razón / podría aclarar eso en las explicaciones? 2. Creo que esta situación está funcionando en última instancia con el mismo fenómeno que la Paradoja de Simpson , solo que enmarcada de manera diferente (abordando el tema desde la otra dirección, por así decirlo). ¿Es esa una evaluación justa?
gung - Restablece a Monica
3
@gung, gracias por hacer esas aclaraciones. Las cifras, por supuesto, deben representar algunas proporciones para que funcionen, pero cualquier proporción no especificada específicamente en el enunciado del problema puede variar libremente. (Construí la figura para que aproximadamente el 50% de la población parezca femenina, anticipando una edición posterior en la que se asumió esto). La idea de aplicar esta representación gráfica para comprender la paradoja de Simpson es intrigante; Creo que tiene mérito.
whuber
13

Esta es una cuestión de probabilidad condicional. Sabes que la persona tiene el pelo largo y el tipo de sangre Ax3. Deje A = { 'La persona tiene el pelo largo' } Entonces buscas P ( C | A y B ) . Usted sabe que P ( C | A ) = 0.9 y P ( C | B ) = 0.8 . ¿Es eso suficiente para calcular P ( C | A y B ) ? Suponga que P ( A y B y C ) = 0.7

     A={'The person has long hair'}              B={'The person has blood type Ax3'}C={'The person is female'}.

P(C|A and B)P(C|A)=0.9P(C|B)=0.8
P(C|A and B)P(A and B and C)=0.7. Entonces Suponga que P ( A y B ) = 0.8 . Entonces, por lo anterior, P ( C | A y B ) = 0.875
P(C|A and B)=P(A and B and C)/P(A and B)=0.7/P(A and B).
P(A and B)=0.8P(C|A and B)=0.875. Por otro lado, si , entonces tendríamos P ( C | A y B ) = 0.78.P(A and B)=0.9P(C|A and B)

Ahora ambos son posibles cuando y P ( C | B ) = 0.8 . Entonces no podemos decir con certeza qué es P ( C | A y B ) .P(C|A)=0.9P(C|B)=0.8P(C|A and B)

Michael R. Chernick
fuente
Hola Michael, si te leo correctamente, estás diciendo que la pregunta planteada no puede responderse, ¿no es así? O para decirlo de otra manera, ¿necesitarías más información para responder esta pregunta? 1. Supongamos que el tipo de sangre raro en mi pregunta original no tiene ningún impacto en el deseo o la capacidad de una persona de dejarse crecer el cabello. ¿Se puede responder la pregunta ahora? 2. ¿Estaría de acuerdo en que la respuesta debe ser MAYOR que 0.9? (Debido a que tiene una segunda información independiente - tipo de sangre - que refuerza la hipótesis de que la persona es una mujer)
Probablemente
2
Si es independiente, entonces P ( A  y  B ) = P ( A ) P ( B ) y deberá especificar qué fracción de personas tiene cabello largo, es decir, P ( A ) y qué fracción de las personas tienen sangre tipo Ax3, es decir, P ( B ) . Además, no puede decir que la respuesta debe ser mayor que 0.9, lo que equivale a afirmar que P ( C | A  y  B )P(A and B)P(A and B)=P(A)P(B)P(A)P(B) (Realmente no veo por qué). P(C|A and B)>0.9
Néstor
2
@ProbablyWrong. Sí, el problema como se indicó inicialmente no tiene información suficiente para una respuesta única.
Michael R. Chernick
@ Néstor, Micahael, no estoy de acuerdo con que necesitemos saber qué fracción de personas tiene el pelo largo o qué fracción de personas tiene el tipo de sangre AX3. Creo que la respuesta a la pregunta original se resuelve de manera única sin saber esto (suponiendo que A y B sean independientes, lo que todos tenemos, y suponiendo que sepamos la división de hombres y mujeres en toda la población, no es irrazonable suponer que eso es aproximadamente 50:50 , Yo creo que).
Probablemente
77
¿Por qué Pensé que P ( C | A B ) = P ( C ( A B ) )
P(C|A and B)=P(A and B and C)×P(A and B)??
usando la definición de probabilidad condicional.
P(C|AB)=P(C(AB))P(AB)=P(ABC)P(AB)
Dilip Sarwate
4

Discusión fascinante! Me pregunto si también especificamos P (A) y P (B) si los rangos de P (C | A, B) no serán mucho más estrechos que el intervalo completo [0,1], simplemente debido a las muchas restricciones tenemos.

Cumpliendo con la notación presentada anteriormente:

A = el evento de que la persona tiene cabello largo

B = el evento de que la persona tiene tipo de sangre AX3

C = el evento de que esa persona es mujer

P (C | A) = 0.9

P (C | B) = 0.8

P (C) = 0.5 (es decir, supongamos una proporción igual de hombres y mujeres en la población en general)

¡no parece posible suponer que los eventos A y B son condicionalmente independientes dado C! Eso lleva directamente a una contradicción: siP(AB|C)=P(A|C)P(B|C)=P(C|A)P(A)P(C)P(C|B)P(B)P(C)

luego

P(C|AB)=P(AB|C)(P(C)P(AB))=P(C|A)P(A)P(C)P(C|B)P(B)P(C)(P(C)P(AB))

P(AB)=P(A)P(B)

P(C|AB)=P(C|A)P(C|B)P(C)=0.90.80.5>1

P(C|AB)[0,1]P(A)P(B)P(A)P(B)

P(C|AB)

P(C|A)=0.9

P(C)=0.5

P(C|B)=0.8

4. (trivial) El rectángulo superior no se puede mover más allá del límite izquierdo y no se debe mover más allá de su superposición mínima a la izquierda.

5. (trivial) El rectángulo inferior no se puede mover más allá del límite derecho y no se debe mover más allá de su superposición máxima a la derecha.

P(C|AB)ingrese la descripción de la imagen aquí

Ejecutar un rango de valores posibles para P (A) y P (B) ( secuencia de comandos R ) genera este gráfico ingrese la descripción de la imagen aquí

En conclusión, podemos reducir el límite de la probabilidad condicional P (c | A, B) para P (A), P (B) dados

Markus Loecher
fuente
2
A,B,C
1
@whuber: gracias por el comentario útil! Espero que las nuevas ediciones lo hagan más legible y claro.
Markus Loecher
@whuber y otros: esperaba volver a encender la discusión, pero el hilo parece haberse quedado inactivo. ¿No hay más comentarios de nadie?
Markus Loecher
1

Hacer la hipótesis es que la persona detrás de una cortina es una mujer.

Hemos dado 2 piezas de evidencia, a saber:

Evidencia 1: Sabemos que la persona tiene cabello largo (y nos dicen que el 90% de todas las personas con cabello largo son mujeres)

Evidencia 2: Sabemos que la persona tiene un tipo sanguíneo raro AX3 (y nos dicen que el 80% de todas las personas con este tipo de sangre son mujeres)

Dada solo la Evidencia 1, podemos afirmar que la persona detrás de una cortina tiene un valor de probabilidad de 0.9 de ser una mujer (suponiendo una división 50:50 entre hombres y mujeres).

Con respecto a la pregunta planteada anteriormente en el hilo, a saber, "¿Estaría de acuerdo en que la respuesta debe ser MAYOR que 0.9?", Sin hacer ninguna matemática, diría intuitivamente, la respuesta debe ser "sí" (es MAYOR que 0.9). La lógica es que la Evidencia 2 respalda la evidencia (una vez más, suponiendo una división 50:50 para el número de hombres y mujeres en el mundo). Si se nos dijera que el 50% de todas las personas con sangre tipo AX3 eran mujeres, entonces la Evidencia 2 sería neutral y no influiría. Pero como se nos dice que el 80% de todas las personas con este tipo de sangre son mujeres, la Evidencia 2 respalda la evidencia y, lógicamente, debería impulsar la probabilidad final de una mujer por encima de 0.9.

Para calcular una probabilidad específica, podemos aplicar la regla de Bayes para la Evidencia 1 y luego usar la actualización Bayesiana para aplicar la Evidencia 2 a la nueva hipótesis.

Suponer:

A = el evento de que la persona tiene cabello largo

B = el evento de que la persona tiene tipo de sangre AX3

C = el evento de que la persona es mujer (suponga 50%)

Aplicando la regla de Bayes a la Evidencia 1:

P (C | A) = (P (A | C) * P (C)) / P (A)

En este caso, de nuevo si suponemos una división 50:50 entre hombres y mujeres:

P (A) = (0.5 * 0.9) + (0.5 * 0.1) = 0.5

Entonces, P (C | A) = (0.9 * 0.5) / 0.5 = 0.9 (No es sorprendente, pero sería diferente si no tuviéramos una división 50:50 entre hombres y mujeres)

Usando la actualización Bayesiana para aplicar la Evidencia 2 y conectando 0.9 como la nueva probabilidad previa, tenemos:

P (C | A Y B) = (P (B | C) * 0.9) / P (E)

Aquí, P (E) es la probabilidad de la Evidencia 2, dadas las hipótesis de que la persona ya tiene un 90% de posibilidades de ser mujer.

P (E) = (0.9 * 0.8) + (0.1 * 0.2) [esta es la ley de probabilidad total: (P (mujer) * P (AX3 | mujer) + P (hombre) * P (AX3 | hombre)] Entonces , P (E) = 0,74

Entonces, P (C | A Y B) = (0.8 * 0.9) / 0.74 = 0.97297

RandomAnswer
fuente
1
Hay algunas declaraciones en su respuesta que no tienen sentido para mí. (1) P (C | A) = 0.9 por supuesto. En ninguna parte se dijo que P (C) = 0.9. Asumimos P (C) = 0.5. (2) ¿Cómo obtuvo el resultado para P (E)? P (mujer) = P (hombre) = 0.5 asumiendo que escribe P (mujer) = 0.9.
Michael R. Chernick
El valor de P (C) se supone en 0.5, que es lo que he usado. El valor de P (E) es la probabilidad de la Evidencia 2 después de aplicar la Evidencia 1 (lo que lleva a una nueva hipótesis de que la probabilidad de que la persona sea mujer es 0.9). P (E) = (probabilidad de que la persona sea mujer (dada Evience 1) * probabilidad de que la persona tenga AX3 si es mujer) + (probabilidad de que la persona sea hombre (dada Evience 1) * probabilidad de que la persona tenga AX3 si un hombre) = (0.9 * 0.8) + (0.1 * 0.2) = 0.74
Respuesta aleatoria
Su definición de probabilidad de E es un poco confusa y los términos que está utilizando para calcularlo se ven diferentes de lo que escribió anteriormente. Aunque realmente no importa. La respuesta es aparentemente correcta según la respuesta bien presentada de Huu.
Michael R. Chernick
@Michael Excepto que parece que Huu cometió errores.
whuber
2
Esta respuesta es simplemente incorrecta. Puede haber otros errores, pero este es evidente. Indicas una respuesta definitiva para P ("Tiene cabello largo") (tu P (A)), y luego la usas para dar tu respuesta definitiva definitiva. Simplemente no hay suficiente información para determinar esto, incluso suponiendo que P (F) = 0.5. Su línea para calcular P (A) parece provenir de la nada. Aquí está la fórmula correcta usando el teorema de Bayes: P (A) = P (A | F) P (F) / P (F | A) desde el cual, usando sus supuestos establecidos, llega a P (A) = P (A | F) * 5/9. Sin embargo, todavía no sabemos P (A | F), que podría ser cualquier cosa.
Bogdanovist
0

Reformulación y generalización de preguntas

UNAsido0 01ZyoZyo(XEl |Y)XY(UNAunaEl |sisidodoyo)

  1. (UNAuna1El |sisi1yo)=tu1 y(UNAuna2El |dodo2yo)=tu2
  2. (UNAuna1El |sisi1yo)=tu1 y (UNAuna2El |dodo2yo)=tu2 y (sidoEl |yo)=(siEl |yo)(doEl |yo)
  3. (UNAuna1El |sisi1yo)=tu1 y (UNAuna2El |dodo2yo)=tu2 y (UNA0 0El |yo)=12
  4. (UNAuna1El |sisi1yo)=tu1 y (UNAuna2El |dodo2yo)=tu2 y (UNA0 0El |yo)=12 y (sidoEl |yo)=(siEl |yo)(doEl |yo)

y eso yono contiene información relevante además de lo que está implícito en las tareas? El último conjunto de condiciones 2 y 4 es la abreviatura de la declaración de independencia

(sijdokEl |yo)=(sijEl |yo)(dokEl |yo),j=0 0,1k=0 0,1
Trate cada uno de los cuatro casos por turno.

Respuestas

Caso 1

Tenemos que especificar la distribución. (UNAsidoEl |yo). El problema está indeterminado, porque(UNAsidoEl |yo) requiere ocho números, pero solo tenemos tres ecuaciones: las dos condiciones dadas y la condición de normalización.

Se ha demostrado por diversos medios esotéricos que la distribución a asignar cuando la información no determina una solución es la que, de todas las distribuciones consistentes con la información conocida, tiene la mayor entropía. Cualquier otra distribución implica que sabemos más que la información conocida, lo que por supuesto es una contradicción.

Todo lo que necesitamos hacer, por lo tanto, es asignar la distribución máxima de entropía. Esto es más fácil decirlo que hacerlo, y no he encontrado una solución general de forma cerrada. Pero se pueden encontrar soluciones particulares utilizando un optimizador numérico. Maximizamos

-yo,j,k(UNAyosijdokEl |yo)En(UNAyosijdokEl |yo)
sujeto a las restricciones
yo,j,k(UNAyosijdokEl |yo)=1
y
(UNAuna1El |sisi1yo)=tu1es decirk(UNAuna1sisi1dokEl |yo)yo,k(UNAyosisi1dokEl |yo)=tu1
y
(UNAuna2El |dodo2yo)=tu2es decirj(UNAuna2sijdodo2El |yo)yo,j(UNAyosijdodo2El |yo)=tu2
Ahora apliquemos esto a la pregunta. Si tenemos

  1. "La persona es mujer" UNA1
  2. "La persona tiene el pelo largo" si1
  3. "La persona tiene sangre tipo AX3" do1

luego una=1, si=1, do=1, una1=1, si1=1, una2=1, do2=1, tu1=0.9, tu2=0.8, y encontramos que para la solución de entropía máxima, (UNA1El |si1do1yo)0.932. Por lo tanto, la probabilidad de que la persona detrás de la cortina sea femenina, dado que tiene el pelo largo y el tipo de sangre AX3, es 0.932.

Caso 2

Ahora repetimos el ejercicio con la restricción adicional de que, para una persona determinada, conocer el valor de si (el estado del cabello) no afecta nuestra estimación del valor de do(el estado del tipo de sangre), y viceversa. Todo es igual que en el caso 1, excepto que hay dos restricciones adicionales en la optimización, a saber:

(si0 0El |dolyo)=(si0 0El |yo),l=0 0,1
es decir
i(AiB0Cl|I)i,j(AiBjCl|I)=i,k(AiB0Ck|I),l=0,1
This gives (A1|B1C1I)0.936, so the probability that the person behind the curtain is female, given that he/she has long hair and blood type AX3, is 0.936.

Case 3

Now we remove the independence condition and replace it with the prior condition that there is an equal chance that a given person is male or female:

(A0|I)=12i.e.j,k(A0BjCk|I)=12
This time (A1|B1C1I)0.973, por lo que la probabilidad de que la persona detrás de la cortina sea femenina, dado que tiene el pelo largo y el tipo de sangre AX3, es 0.973.

Caso 4

Finalmente, reintroducimos las restricciones de independencia del Caso 2, y encontramos que (UNA1El |si1do1yo)0,989. Por lo tanto, la probabilidad de que la persona detrás de la cortina sea femenina, dado que tiene el cabello largo y el tipo de sangre AX3, es 0.989.

CarbonFlambe Reinstate Monica
fuente
-2

Ahora creo que, si asumimos una proporción de hombres y mujeres en la población en general, entonces hay una única respuesta indiscutible.

A = el evento de que la persona tiene cabello largo

B = el evento de que la persona tiene tipo de sangre AX3

C = el evento de que esa persona es mujer

P (C | A) = 0.9

P (C | B) = 0.8

P (C) = 0.5 (es decir, supongamos una proporción igual de hombres y mujeres en la población en general)

Entonces P (C | A y B) = [P (C | A) x P (C | B) / P (C)] / [[P (C | A) x P (C | B) / P (C )] + [[1-P (C | A)] x [1-P (C | B)] / [1-P (C)]]]

en este caso, P (C | A y B) = 0.972973

Probablemente equivocado
fuente
P [C | A y B) = P (A y B y C) / P (A y B) = P (A y B y C) / [P (A | B) P (B)]. ¿Cómo obtuviste tu fórmula?
Michael R. Chernick
Probablemente haya una manera de agregar condiciones para que obtenga una respuesta única.
Michael R. Chernick
Para agregar por independencia de A y B, la fórmula se simplifica a P (A y B y C} / [P (A) P (B)] = P (B y C | A) / P (B).
Michael R. Chernick
2
La intención de mi pregunta era realmente que justificaras la fórmula. No entiendo cómo se derivaría.
Michael R. Chernick
2
No, la respuesta que supuestamente usó la regla de Bayes es incorrecta. No estoy seguro de por qué estás confundido, la fórmula de MC anterior es correcta y no se puede usar para obtener ningún resultado, ¡eso es lo que explicaron sus respuestas y las de Whuber a la pregunta!
Bogdanovist
-2

Nota: Para obtener una respuesta definitiva, las respuestas a continuación suponen que la probabilidad de que una persona, un hombre de cabello largo y una mujer de cabello largo tengan AX3 es aproximadamente la misma. Si se desea más precisión, esto debería verificarse.

Comienzas con el conocimiento de que la persona tiene el pelo largo, por lo que en este punto las probabilidades son:

90:10

Nota: La proporción de hombres y mujeres en la población general no nos importa una vez que descubrimos que la persona tiene el pelo largo. Por ejemplo, si hubiera 1 mujer de cada cien en la población general, una persona de pelo largo seleccionada al azar seguiría siendo una mujer el 90% del tiempo. ¡La relación entre mujeres y hombres sí importa! (vea la actualización a continuación para más detalles)

Luego, aprendemos que la persona tiene AX3. Debido a que AX3 no está relacionado con el cabello largo, se sabe que la proporción de hombres a mujeres es 50:50, y debido a nuestra suposición de que las probabilidades son las mismas, simplemente podemos multiplicar cada lado de la probabilidad y normalizar para que la suma de los lados de la probabilidad es igual a 100:

(90:10) * (80:20)
==> 7200:200

    Normalize by dividing each side by (7200+200)/100 = 74

==> 7200/74:200/74
==> 97.297.. : 2.702..

Por lo tanto, la probabilidad de que la persona detrás de la cortina sea femenina es aproximadamente del 97.297%.

ACTUALIZAR

Aquí hay una exploración más profunda del problema:

Definiciones:

f - number of females
m - number of males
fl - number of females with long hair
ml - number of males with long hair
fx - number of females with AX3
mx - number of males with AX3
flx - number of females with long hair and AX3
mlx - number of males with long hair and AX3
pfl - probability that a female has long hair
pml - probability that a male has long hair
pfx - probability that a female has AX3
pmx - probability that a male has AX3

Primero, se nos dice que el 90% de las personas de cabello largo son mujeres, y el 80% de las personas con AX3 son mujeres, entonces:

fl = 9 * ml
pfl = fl / f
pml = ml / m 
    = fl / (9 * m)

fx = 4 * mx
pfx = fx / f
pmx = mx / m 
    = fx / (4 * m)

Debido a que asumimos que la probabilidad de AX3 es independiente del género y el cabello largo, nuestro pfx calculado se aplicará a las mujeres con cabello largo, y pmx se aplicará a los hombres con cabello largo para encontrar el número de ellas que probablemente tengan AX3:

flx = fl * pfx 
    = fl * (fx / f) 
    = (fl * fx) / f
mlx = ml * pmx 
    = (fl / 9) * (fx / (4 * m)) 
    = (fl * fx) / (36 * m)

Por lo tanto, la proporción probable de la cantidad de mujeres con cabello largo y AX3 con respecto a la cantidad de hombres con cabello largo y AX3 es:

flx             :   mlx
(fl * fx) / f   :   (fl * fx) / (36 * m)
1/f             :   1 / (36m)
36m             :   f

Debido a que se da el mismo número de 50:50, puede cancelar ambos lados y terminar con 36 hembras por cada macho. De lo contrario, hay 36 * m / f mujeres por cada hombre en el subgrupo especificado. Por ejemplo, si hubiera el doble de mujeres que hombres, habría 72 mujeres por cada hombre de los que tienen cabello largo y AX3.

Briguy37
fuente
1
Esta solución se basa en suponer más de lo que se indica actualmente en el problema: a saber, que el pelo largo, AX3 y el género son independientes. De lo contrario, no puede justificar "aplicar" pfx a mujeres con cabello largo, etc.
whuber
@whuber: Sí, hago esa suposición. Sin embargo, ¿no es el propósito de la probabilidad dar la mejor aproximación basada en los datos que tiene? Por lo tanto, como ya sabe que el pelo largo y el AX3 son independientes para la población general, DEBERÁ llevar esa suposición a hombres y mujeres hasta que aprenda explícitamente lo contrario. De acuerdo, no es universalmente correcto, pero es el mejor que puede hacer hasta que obtenga más información. P: Con solo los datos actuales, si tuviera que dar el% de posibilidades de que fuera una mujer detrás de la cortina, ¿realmente diría "entre 0 y 100%"?
Briguy37
1
Tenemos una diferencia importante en filosofía, @Briguy. Creo firmemente en no hacer suposiciones infundadas. No está claro en qué sentido la suposición de independencia mutua es "mejor": concederé que puede ser en ciertas aplicaciones. Pero en general, eso me parece peligroso. Preferiría tener claros los supuestos necesarios para resolver un problema, de modo que las personas puedan decidir si vale la pena recopilar los datos para verificar esos supuestos, en lugar de suponer cosas que son matemáticamente convenientes por el simple hecho de obtener una respuesta. Esa es la diferencia entre estadísticas y matemáticas.
whuber
Para responder a su pregunta: sí, 0% - 100% es exactamente la respuesta que daría. (He dado respuestas similares a preguntas comparables en este sitio). Ese rango refleja con precisión la incertidumbre. Este tema está estrechamente relacionado con la paradoja de Ellsberg . El artículo original de Ellsberg está bien escrito y es claro: lo recomiendo.
whuber
@whuber: Gracias por tomarse el tiempo para dialogar conmigo. Veo su punto sobre la importancia de pensar y enumerar las suposiciones hechas, y he actualizado mi respuesta en consecuencia. Sin embargo, en lo que respecta a su respuesta, creo que está incompleta. La razón de esto es que puede considerar todos los casos desconocidos y encontrar la probabilidad promedio de llegar a su respuesta final. EG Aunque ambos todavía son posibles, las probabilidades por encima del 50% son mucho más frecuentes que las probabilidades por debajo del 50% en todos los casos, por lo que seguramente es mejor adivinar que es una mujer.
Briguy37
-4

98% Femenino, interpolación simple. Primera premisa 90% hembra, deja 10%, segunda premisa solo deja 2% del 10% existente, por lo tanto 98% hembra

xcythe
fuente