Cito (el énfasis es mío) de la definición de Wikipedia :
La proposición en la teoría de probabilidad conocida como la ley de la expectativa total, ..., establece que si X es una variable aleatoria integrable (es decir, una variable aleatoria que satisface E (| X |) <∞) e Y es cualquier variable aleatoria, no necesariamente integrable, en el mismo espacio de probabilidad , entonces
No entiendo lo que quieren decir con el mismo espacio de probabilidad, y no sé por qué esta es una parte importante de la definición. Tome el ejemplo más abajo en la página:
Supongamos que dos fábricas suministran bombillas al mercado. Las bombillas Factory X funcionan durante un promedio de 5000 horas, mientras que las bombillas Factory Y funcionan durante un promedio de 4000 horas. Se sabe que la fábrica X suministra el 60% del total de bombillas disponibles. ¿Cuál es el período de tiempo esperado que funcionará una bombilla comprada?
Las variables aleatorias aquí parecen ser:
- La cantidad de tiempo que dura una bombilla.
- De qué fábrica proviene una bombilla.
¿Cómo pueden estos dos tener el mismo espacio de probabilidad?
Respuestas:
Ese es el problema.
La forma estándar de pensar en los objetos de la teoría de la probabilidad (variables aleatorias, distribuciones, etc.) es a través de los axiomas de Kolmogorov . Estos axiomas están enmarcados en el lenguaje de la teoría de la medida , pero es muy posible comprender casos simples sin ninguna teoría de la medida.
Básicamente, un modelo de probabilidad consta de tres cosas: un conjunto , cuyos elementos individuales se pueden considerar como un resumen del "verdadero estado del mundo" (o al menos todo lo que necesita saber al respecto); una colección de subconjuntos de (cuyos elementos son los posibles eventos cuya probabilidad puede necesitar medir); y una medida de probabilidad , que es una función que toma un evento y escupe un número (cuya interpretación es la probabilidad de que ocurra el evento ). El triple se conoce como espacio de probabilidadΩ F Ω P E∈F P(E)∈[0,1] E (Ω,F,P) siempre que satisfaga ciertas propiedades naturales (por ejemplo, la probabilidad de una unión de innumerables eventos disjuntos es la suma de sus probabilidades).
En este marco, una variable aleatoria es una función de a . En su ejemplo, tenemos dos variables aleatorias: (la cantidad de tiempo que dura una bombilla) y (de qué fábrica proviene una bombilla).X Ω R T F
La pregunta ahora es: ¿cómo definimos un espacio de probabilidad y las funciones de tal manera que modele el problema bajo consideración. Hay muchas formas, pero una simple es dejar que . Un elemento especifica una bombilla particular (no aleatoria) de fábrica que durará por el tiempo . Entonces definiríamos y . La distribución conjunta de se define entonces especificando y .(Ω,F,P) T,F:Ω→R Ω={(f,t):f=0,1,t>0} (f,t)∈Ω f t T(f,t)=t F(f,t)=f (T,F) F P
La expectativa condicional de una variable aleatoria dada otra variable aleatoria se define a sí misma como un tipo de variable aleatoria que satisface ciertas propiedades. Puede encontrar la definición formal aquí , sin embargo, puede parecer bastante arcano si no está familiarizado con la probabilidad teórica de la medida. Básicamente, esta definición no tiene sentido si e no están definidos en el mismo espacio de probabilidad. Sin embargo, en última instancia, generalmente no es problemático definir dos variables aleatorias en un espacio de probabilidad común, por lo que esta condición equivale a un tecnicismo.E[X∣Y] X Y X Y
fuente