La fórmula para la probabilidad condicional de que ocurra dado que ha sucedido es:
Mi libro de texto explica la intuición detrás de esto en términos de un diagrama de Venn.
Dado que ha ocurrido, la única manera de que ocurra es que el evento caiga en la intersección de y .
En ese caso, la probabilidad de sería simplemente igual a la probabilidad de intersección , ya que esa es la única forma en que podría suceder el evento? ¿Qué me estoy perdiendo?
Respuestas:
Se da una buena intuición de que B ocurrió, con o sin A, ¿cuál es la probabilidad de A? Es decir, ahora estamos en el universo en el que ocurrió B: el círculo completo a la derecha. En ese círculo, la probabilidad de A es el área de la intersección de A B dividida por el área del círculo.
fuente
Lo pensaría así: doy por sentado que entiendes la intuición hasta que:
y voy a comentar la segunda imagen que publicaste:
Imagine que todo el rectángulo blanco es su espacio muestral .Ω
Asignar una probabilidad a un conjunto significa que está midiendo en cierto sentido ese conjunto. Es lo mismo que si midieras el área del rectángulo, pero la probabilidad es un tipo diferente de medida que tiene propiedades específicas (no diré nada más sobre esto).
Sabes que y esto se interpreta así:P(Ω)=1
representa todos los eventos que podrían suceder y algo tiene que suceder, por lo que tenemos una probabilidad del 100% de que algo suceda.Ω
Análogamente, el conjunto tiene una probabilidad P ( A ) que es proporcional a la probabilidad del espacio muestral Ω . Hablando gráficamente, ve que A ⊂ Ω, por lo tanto, la medida de A (su probabilidad P ( A ) ) tiene que ser menor que P ( Ω ) . El mismo razonamiento es válido para el conjunto A ∩ B . Este conjunto se puede medir y su medida es P ( A ∩ B ) .A P( A) Ω A ⊂ Ω UNA PAGS( A ) PAGS( Ω ) A ∩ B PAGS( A ∩ B )
Si ahora te dicen que ha sucedido, debes pensar como si B fuera tu "nuevo" Ω . Si B es su "nueva" Ω entonces usted puede estar 100% seguro de que todo lo que sucede en el conjunto B .si si Ω si Ω si
¿Y qué significa eso? Esto significa que ahora, en el "nuevo" concurso de , y usted tiene que cambiar la escala de todas las medidas de probabilidad, teniendo en cuenta que tienen que ser expresada en términos de la "nueva" muestra el espacio B . Es una proporción simple.PAGS( B ∣ B ) = 1 si
Tu intuición es casi correcta cuando dices eso:
y el "casi" se debe al hecho de que ahora su espacio de muestra ha cambiado (ahora es ) y desea reescalar P ( A ∩ B ) en consecuencia.si PAGS( A ∩ B )
es su P ( A ∩ B ) en el nuevo mundo en el que el espacio muestral es ahora B . En palabras, lo diría así (e intente visualizarlo en la imagen con los conjuntos):PAGS( A ∣ B ) PAGS( A ∩ B ) si
En el nuevo mundo, la razón entre la medida de y la medida de A ∩ B debe ser la misma que la razón entre la medida de Ω y la medida de A ∣ Bsi A ∩ B Ω A ∣ B
Por último, traduzca esto en lenguaje matemático (una proporción simple):
y como se deduce que:PAGS( Ω ) = 1
fuente
Verá la intuición fácilmente pensando en el siguiente problema.
Supongamos que tienes 10 bolas: 6 negras y 4 rojas. De las bolas negras 3 son impresionantes y de las bolas rojas solo 1 es impresionante. ¿Qué posibilidades hay de que una bola negra también sea impresionante?
La respuesta es muy fácil: es 50%, porque tenemos 3 bolas negras impresionantes de un total de 6 bolas negras.
Así es como se asignan las probabilidades a nuestro problema:
fuente
Para una intuición básica de la fórmula de probabilidad condicional, siempre me gusta usar una tabla de dos vías. Digamos que hay 150 estudiantes en un grupo de año, de los cuales 80 son mujeres y 70 hombres, cada uno de los cuales debe estudiar exactamente un curso de idiomas. La tabla bidireccional de estudiantes que toman diferentes cursos es:
Dado que un estudiante toma el curso de italiano, ¿cuál es la probabilidad de que sea mujer? Bueno, el curso de italiano tiene 60 estudiantes, de los cuales 40 son mujeres que estudian italiano, por lo que la probabilidad debe ser:
donde es la cardinalidad del conjunto A , es decir, el número de elementos que contiene. Tenga en cuenta que necesitábamos usar n ( F ∩ italiano ) en el numerador y no solo n ( F ) , porque este último habría incluido a las 80 mujeres, incluidas las otras 40 que no estudian italiano.n ( A ) UNA n ( F ∩ italiano ) n(F)
Pero si la pregunta se voltea, ¿cuál es la probabilidad de que un estudiante tome el curso de italiano, dado que son mujeres? Luego, 40 de las 80 alumnas toman el curso de italiano, por lo que tenemos:
Espero que esto proporcione intuición de por qué
Comprender por qué la fracción se puede escribir con probabilidades en lugar de cardinalidades es una cuestión de fracciones equivalentes . Por ejemplo, volvamos a la probabilidad de que un estudiante sea mujer dado que está estudiando italiano. Hay 150 estudiantes en total, por lo que la probabilidad de que un estudiante sea mujer y estudie italiano es 40/150 (esta es una probabilidad "conjunta") y la probabilidad de que un estudiante estudie italiano es 60/150 (esta es una probabilidad "marginal" ) Tenga en cuenta que dividir la probabilidad conjunta por la probabilidad marginal da:
(Para ver que las fracciones son equivalentes, multiplicar el numerador y el denominador por 150 elimina el "/ 150" en cada uno).
En términos más generales, si su espacio de muestreo tiene cardinalidad n ( Ω ) , en este ejemplo la cardinalidad era 150, encontramos queΩ n(Ω)
fuente
Yo revertiría la lógica. La probabilidad de que tanto como B sea:A B
Esto te dará
Si usted está buscando una negativa a su sugerencia, es si bien es cierto que la probabilidad de dado B está contenido en la probabilidad de que el producto, el espacio que está rodando los dados en es más pequeño que el espacio de probabilidad inicial - usted sabe seguro que estás "en" B , por lo tanto, divides por el tamaño del nuevo espacio.A B B
fuente
El diagrama de Venn no representa la probabilidad, representa la medida de subconjuntos del espacio de eventos. Una probabilidad es la razón entre dos medidas; la probabilidad de X es el tamaño de "todo lo que constituye X" dividido el tamaño de "todos los eventos considerados". Cada vez que esté calculando una probabilidad, necesita tanto un "espacio de éxito" como un "espacio de población". No se puede calcular una probabilidad basada solo en "cuán grande" es el espacio de éxito. Por ejemplo, la probabilidad de lanzar un siete con dos dados es el número de formas de lanzar un siete dividido por el número total de formas de lanzar dos dados. El simple hecho de saber la cantidad de formas de sacar un siete no es suficiente para calcular la probabilidad. P (A | B) es la razón de la medida de "tanto A como B suceden" espacio y la medida del espacio "B sucede". Eso es lo que el "|" significa: significa "hacer de lo que viene después de esto el espacio poblacional".
fuente
Creo que la mejor manera de pensar en esto es dibujando caminos paso a paso.
Describamos el Evento B como sacar un en un dado justo: se puede demostrar fácilmente que tiene probabilidad 14 . Ahora describamos el Evento A como sacar un As de un mazo de cartas estándar de 52 cartas: se puede demostrar fácilmente que tiene probabilidad116 .113
Ejecutemos ahora un experimento donde tiramos un dado y luego elegimos una carta. Entonces sería la probabilidad de que saquemos un As, dado que ya hemos sacado un 4 . Si miras la imagen, este sería el 1P(A|B) 4 camino (subir) y luego el116 camino (subir de nuevo).113
Intuitivamente, el espacio de probabilidad total es lo que ya se nos ha dado: sacar el . Podemos ignorar el 14 y12113 el camino descendente inicial conduce, ya que fue DADO que lanzamos un4. Por ley de multiplicación, nuestro espacio total es entonces(11213 4 .(16×113)+(16×1213)
¿Cuál es la probabilidad de que saquemos un As, DADO que sacamos un ? La respuesta al usar la ruta es ( 14 , que luego debemos dividir por el espacio total. Entonces obtenemosP(A(16×113)
fuente
Piénselo en términos de conteos. La probabilidad marginal es cuántas veces se produjo A dividido por el tamaño de la muestra. La probabilidad conjunta de A y B es cuántas veces ocurrió A junto con B dividido por el tamaño de la muestra. La probabilidad condicional de A dado B es cuántas veces ocurrió A junto con B dividido por cuántas veces ocurrió B, es decir, solo las A "dentro" de B.
Puedes encontrar una buena ilustración visual en este blog , que lo muestra usando bloques de Lego.
fuente
En el momento de escribir, hay alrededor de 10 respuestas que parecen perder el punto más importante: usted tiene toda la razón.
fuente
Siento que es más intuitivo cuando tenemos datos concretos para estimar las probabilidades.
Usemos los
mtcars
datos como ejemplo, los datos se ven así (solo usamos el número de cilindros y el tipo de transmisión).Podemos calcular la distribución conjunta en dos variables haciendo una tabla cruzada:
La probabilidad conjunta significa que queremos considerar dos variables al mismo tiempo. Por ejemplo, preguntaremos cuántos automóviles son de 4 cilindros y transmisión manual.
Ahora, llegamos a la probabilidad condicional. Encontré que la forma más intuitiva de explicar la probabilidad condicional es usar el término filtrado de datos.
Esto significa que solo nos importan los automóviles que tengan 4 cilindros. Entonces filtramos datos sobre eso. Después de filtrar, verificamos cuántos de ellos son de transmisión manual.
Puede comparar esto condicional con la articulación que mencioné anteriormente para sentir las diferencias.
fuente
Si
A
fuera un superconjunto deB
la probabilidad de queA
ocurra siempre es 1 dado queB
sucedió, es decirP(A|B) = 1
. Sin embargo,B
sí mismo puede tener una probabilidad mucho menor que 1.Considere el siguiente ejemplo:
x
es un número natural en 1..100,A
es 'x
es un número par'B
es 'x
es divisible por 10'entonces tenemos:
P(A)
es 0.5P(B)
es 0.1Si sabemos que
x
es divisible por 10 (x
es decir, está dentroB
), sabemos que también es un número par (x
es decir, está dentroA
)P(A|B) = 1
.De la regla de Bayes tenemos:
x
x
Para un ejemplo no degenerado, considere, por ejemplo,
A
es 'x
es divisible por 7' yB
es 'x
es divisible por 3'. EntoncesP(A|B)
es equivalente a 'dado que sabemos quex
es divisible por 3, ¿cuál es la probabilidad de que (también) sea divisible por 7?'. O, de manera equivalente, '¿Qué fracción de los números 3, 6, ..., 99 son divisibles por 7'?fuente
Creo que su declaración inicial puede ser un malentendido.
Tu escribiste:
De su fraseo, puede sonar como si hubiera 2 eventos "Primero sucedió B, y luego queremos calcular la probabilidad de que A suceda".
Este no es el caso. (Lo siguiente es válido si hubo un malentendido o no).
Tenemos solo 1 evento, que se describe por una de las 4 posibilidades:
ningunoUNA ni si ;
sóloUNA no si ;
sólosi no UNA ;
ambosUNA y si .
Poniendo algunos números de ejemplo, digamos
Resulta que
Inicialmente (sin conocimiento del evento), sabíamosPAGS( AB ) = 0.25 .
Pero una vez que sabemos esosi ha sucedido, estamos en un espacio diferente. PAGS( AB ) es la mitad de PAGS( B ) entonces la probabilidad de UNA dado si , PAGS( AEl |B ) , es 0,5 . No lo es0.25 , sabiendo que si pasó.
fuente
La probabilidad de condicionamiento NO es igual a la probabilidad de intersección. Aquí hay una respuesta intuitiva:
1)PAGS( B ∣ A ) : "Lo sabemos UNA sucedió ¿Cuál es la probabilidad de quesi ¿pasará?"
2:PAGS( A ∩ B ) : "No sabemos si UNA o si sucedió. ¿Cuál es la probabilidad de que ambos sucedan?
La diferencia es que en el primero, tenemos información adicional (sabemos queUNA ocurre primero). En el segundo no sabemos nada.
Comenzando con la probabilidad del segundo, podemos deducir la probabilidad del primero.
El evento que ambosUNA y si ocurrirá puede ocurrir de dos maneras:
1) La probabilidad deUNA Y la probabilidad de si Dado que UNA sucedió
2) La probabilidad desi Y la probabilidad de UNA Dado que si sucedió
Resulta que ambas situaciones son igual de suceder. (No puedo encontrar la razón intuitiva). Por lo tanto, debemos sopesar ambos escenarios con0,5
Ahora usa esoUNA y B ∣ A son independientes y recuerde que ambos escenarios tienen la misma probabilidad de suceder.
Tadaaa ... ¡ahora aísla la probabilidad del condicionamiento!
por cierto. Me encantaría que alguien pudiera explicar por qué los escenarios 1 y 2 son iguales. La clave está ahí, imo.
fuente