Considere las siguientes afirmaciones sobre el Titanic:
Asunción 1: solo hombres y mujeres estaban en el barco
Supuesto 2: había un gran número de hombres y mujeres.
Declaración 1: el 90 por ciento de todas las mujeres sobrevivieron
Declaración 2: 90 por ciento de todos los que sobrevivieron, eran mujeres
El primero indica que salvar a las mujeres probablemente era de alta prioridad (independientemente de si salvar a los hombres era)
¿Cuándo es útil la segunda estadística?
¿Podemos decir que uno de ellos es casi siempre más útil que el otro?
Respuestas:
Tal como están, ninguno de los enunciados 1 o 2 es muy útil. Si el 90% de los pasajeros fueran mujeres y el 90% de las personas sobrevivieran al azar, ambas afirmaciones serían ciertas. Las declaraciones deben considerarse en el contexto de la composición general de los pasajeros. Y la posibilidad general de sobrevivir.
Supongamos que tenemos tantos hombres como mujeres, 100 cada uno. Aquí hay algunas matrices posibles de hombres (M) contra mujeres (W) y sobrevivientes (S) contra muertos (D):
El 90% de las mujeres sobrevivieron. Al igual que el 90% de los hombres. La declaración 1 es verdadera, la declaración 2 es falsa, ya que la mitad de los sobrevivientes eran mujeres. Esto es consistente con muchos sobrevivientes, pero no hay diferencia entre géneros .
El 90% de las mujeres sobrevivieron, pero solo el 10% de los hombres. El 90% de los sobrevivientes eran mujeres. Ambas declaraciones son ciertas. Esto es consistente con una diferencia entre géneros : las mujeres tenían más probabilidades de sobrevivir que los hombres.
El 9% de las mujeres sobrevivieron, pero solo el 1% de los hombres. El 90% de los sobrevivientes eran mujeres. La declaración 1 es falsa, la declaración 2 es verdadera. Esto nuevamente es consistente con una diferencia entre géneros : las mujeres tenían más probabilidades de sobrevivir que los hombres.
fuente
(or indeed, if *everyone* survived)...
Si todos sobrevivieron, el 100% de todas las mujeres sobrevivieron, independientemente de las proporciones.A primera vista, la probabilidad condicional de sobrevivir condicional al sexo es más útil, simplemente debido a la dirección del flujo de información. El sexo de una persona se conoce antes de su estado de supervivencia, y esta probabilidad se puede utilizar en un sentido predictivo, de forma prospectiva. Además, no está influenciado por la prevalencia de las mujeres. En caso de duda, piense en la predicción.
fuente
La palabra "prioridad" viene del latín para "antes". Una prioridad es algo que se antecede a otra cosa (donde "antes" se usa en el sentido de "más importante"). Si dice que salvar a las mujeres era una prioridad, entonces salvar a las mujeres tiene que venir antes que otra cosa. Y la suposición natural es que lo que viene antes es salvar a los hombres. Si dices "independientemente de si salvar hombres era", entonces nos preguntamos qué ocurrió antes.
Que las mujeres tengan una alta tasa de supervivencia no dice mucho, si no sabemos cuál fue la tasa de supervivencia general. En el último barco en el que estaba, más del 90% de las mujeres sobrevivieron, pero no lo caracterizaría como una muestra de que salvar a las mujeres era una alta prioridad.
Y saber qué porcentaje de sobrevivientes eran mujeres no dice mucho sin saber qué porcentaje de personas en general eran mujeres.
Qué estadística es más útil realmente depende de la situación. Si quieres saber qué tan peligroso es algo, la tasa de mortalidad es más importante. Si desea saber qué afecta qué tan peligroso es algo, entonces el desglose porcentual de las víctimas es importante.
fuente
Posiblemente sea útil para nosotros examinar cómo se relacionan estas probabilidades.
Sea el evento de que una persona sea mujer, y sea S el evento de que una persona sobrevivió.W S
Declaración 1:
Declaración 2:
El teorema de Bayes ilustra cómo se relacionan estas declaraciones de probabilidad.
fuente
Depende de lo que uno considere útil.
Por otro lado, si se pregunta por qué las historias de sobrevivientes son principalmente de mujeres, entonces la declaración 2 explicaría eso, haciendo que la declaración 2 sea útil incluso en ausencia de otra información.
No puedo pensar en nada, la declaración 1 es útil fuera de contexto. Ciertamente no dice nada sobre la prioridad dada a salvar mujeres, en comparación con cualquier otra cosa. Lo único que la declaración 1 hace por mí es que me hace decir "dime más".
fuente
En la superficie (o en aislamiento de la realidad) ambas declaraciones parecen ser igualmente inútiles para el objetivo del estado. Sin embargo, considerando el contexto, la segunda declaración es claramente más útil.
Declaración 2
Veamos qué podemos extraer de la segunda declaración. La proporción de mujeresw among all survived is:
Estamos probando hipoH0 0: x > z
Reescribamos la ecuación para obtener las condiciones necesarias paraH0 0 :
So, for your hypo that women were more likely to survive, all you need is to check that there were less than 90% women among the passengers. This is consistent with your assumption 2, which seems to imply thatp≈1/2 . Hence, I declare that statement 2 all but asserts that women were more likely to survive, i.e. it's quite useful for your goal.
Statement 1
The first statement is truly useless in isolation, but has a limited use in the context. If we pretend we know nothing about the event, then saying thatx=0.9 tells us nothing about z , and whether x>z ?
However, from that little that I know about the event - I haven't seen the movie - it seems unlikely thatx≤z . Why?
We know from Assumption 2 thatp≈1/2 , so the total survival rate is
px+(1−p)z . If we assume that x≈z and p≈1/2 we get
Conclusion
Diría que ambas declaraciones respaldan su hipo de que las mujeres tenían más probabilidades de sobrevivir que los hombres, pero la Declaración 1 lo hace de manera bastante débil, mientras que la Declaración 2 en combinación con suposiciones casi seguramente establece su hipo como un hecho.
fuente