Deje que el experimento sea dado por donde es el espacio muestral, es el conjunto de todos los eventos (subconjuntos de que asignamos una probabilidad) y es la medida de probabilidad. Los puntos de se denotan , y son los "eventos elementales" (o "resultados"). Las variables aleatorias en este experimento son funciones y se escriben como , lo que significa que su valor está determinado por el resultado elemental .( X , B , P )XsiXPAGSXωF: X ↦ RF( ω )ω
Corresponde al evento la variable aleatoria indicadora
En este sentido, los eventos se pueden incrustar como un subconjunto del conjunto de todas las variables aleatorias definidas para esta configuración experimental . Entonces la probabilidad de que ocurra puede escribirse como una expectativa
UNA
yoUNA( ω ) = {1 si A se produce, es decir, omega ∈ A . 0 si A no se producen, es decir w ∉ A .
UNAPAGS( A ) = EyoUNA.
A la pregunta adicional en los comentarios: si y son independientes (como eventos), entonces e son independientes (como variables aleatorias). "¿podemos decir que I_A = 1 e I_B = 1 son independientes?" Bueno, es simplemente el evento , ¡así que creo que puedes responder ahora!UNAsiyoUNAyosiyoUNA= 1UNA
Sí, los eventos son como variables booleanas (usted dijo binario, pero supongo que esto es lo que quiere decir) o, más precisamente, para cada evento hay una variable aleatoria booleana correspondiente. Las diferentes comunidades usan una terminología ligeramente diferente (función de indicador, función característica, predicado) para la misma cosa, y el tipo de salida puede ser{ 0 , 1 } o { Fa l s e , Tr u e } .
Usted planteó el punto:
Creo que los textos de probabilidad a menudo no hacen lo suficiente para describir por qué los axiomas de probabilidad son como son, por lo que voy a saludar con la mano:
Supongamos que está inventando los fundamentos de la teoría de la probabilidad. Su primera puñalada podría ser decir que hay algunas posibles formas en que el mundo podría ser:X , y algún tipo de función que asigna probabilidades a cada una de estas posibilidades F: X→[0,1] . Por ejemplo, podríamos decir queX es el conjunto de números del 1 al 6 de un dado y f( X ) = 1 / 6 .
Pronto encontrará que esto es un poco restrictivo porque quiere hablar sobre subconjuntos de mundos posibles, es decir, qué pasa si la tirada de dados es mayor que 3. Por lo tanto, ajusta su teoría y asigna probabilidades a conjuntosμ : P(X) → [ 0 , 1 ] dónde PAGS denota el conjunto de todos los subconjuntos. Cada uno de estos subconjuntos que usted llama un evento, y cuando dice que ocurrió un evento, lo que realmente quiere decir es que el mundo real resultó ser uno de los mundos posibles en ese evento. μ no solo puede asignar probabilidades a conjuntos arbitrariamente, debe ser coherente con F y sentido común.
Está casi satisfecho pero luego se da cuenta de que hay otras cosas que desea modelar que inicialmente no se contabilizaron enX . Por ejemplo, desea hablar sobre la probabilidad de que el dado rebote tres veces. En términos más generales, poniéndose el sombrero de filósofo, usted decide que es imposible (o al menos muy difícil) hablar sobre el mundo real, solo podemos hablar sobre nuestras limitadas observaciones del mismo. Entonces, en su lugar, construyes un nuevo objetoΩ que representa un modelo más rico del mundo (por ejemplo, tal vez es una simulación física muy precisa de una tirada de dados, o incluso de todo el universo) pero solo se le permite hablar de ello con variables aleatorias.
Ahora puede definir en su lugarX como variable aleatoria (una función Ω → N ), y muchos otros que hablan de propiedades de interés. Para cada conjunto de resultados de una variable aleatoria (con un solo resultado como un caso especial) siempre hay un conjunto correspondiente de mundos posibles (subconjunto deΩ ), el evento.
fuente
Para propósitos de comprensión nos limitaremos a espacios de muestra finitos.
En primer lugar, en respuesta a su pregunta, no, el resultado de una variable aleatoria no es un evento. Una variable aleatoria toma como entrada un elemento del espacio muestral y genera un número real.
Por ejemplo, supongamos que sacamos una bola de una urna que tiene 3 bolas etiquetadas como A, B y C. El espacio muestral de todas las bolas en la urna es S = {A, B, C}. Hay 8 eventos posibles: {}, {A}, {B}, {C}, {A, B}, {A, C}, {B, C}, {A, B, C}. El evento {B, C} significa que la bola extraída es B o C.
Una variable aleatoria es una función de valor real en el espacio muestral. Si la variable aleatoria X asigna 10 a A, 10 a B y 30 a C, entonces, si se dibuja A, el valor realizado de X es 10, un número real, no un evento.
Si x es un número, entonces el evento correspondiente a X = x es el conjunto de elementos del espacio muestral que X x asigna. En el ejemplo actual, el evento correspondiente a X = 10 es {A, B} ya que tanto A como B se asignan a 10 y C no.
La relación anterior entre variables aleatorias y eventos se extiende a otros conceptos. Por ejemplo, las variables aleatorias X e Y son independientes si para cada par de números reales x e y los eventos X = x e Y = y son independientes. De manera similar, X e Y son condicionalmente independientes dado Z si los eventos X = x e Y = y son condicionalmente independientes dado el evento Z = z.
(Asumo aquí que la pregunta es sobre la relación entre eventos y variables aleatorias y no sobre las definiciones de probabilidad, independencia e independencia condicional que hemos asumido).
fuente