Una forma de pensar sobre la representación condicional es como una proyección sobre álgebra .GσG
( de Wikimedia commons )
Esto es realmente riguroso cuando se habla de variables aleatorias integrables al cuadrado; en este caso, es en realidad la proyección ortogonal de la variable aleatoria en el subespacio de consiste en variables aleatorias medibles con respecto a . Y, de hecho, esto incluso resulta ser cierto en cierto sentido para las variables aleatorias mediante la aproximación de las variables aleatorias .ξ L 2 ( Ω ) GE[ξ|G]ξL2(Ω)GL 2L1L2
(Ver los comentarios para referencias).
Si se considera que representa la cantidad de información que tenemos disponible (una interpretación que es de rigor en la teoría de los procesos estocásticos), entonces más grandes significan más eventos posibles y, por lo tanto, más información sobre posibles resultados, mientras que son más pequeños significa menos eventos posibles y, por lo tanto, menos información sobre posibles resultados.σ−σ -σ−σ−
Por lo tanto, la proyección de la -medible variable aleatoria en los más pequeños álgebra significa tomar nuestra mejor estimación para el valor de dada la información más limitada disponible de . ξ σ - GFξσ−GGξG
En otras palabras, dada solo la información de , y no toda la información de , es, en un sentido riguroso, nuestro mejor posible adivinar cuál es la variable aleatoria .F E [ ξGFξE[ξ|G]ξ
Con respecto a su ejemplo, creo que podría estar confundiendo variables aleatorias y sus valores. Una variable aleatoria es una función cuyo dominio es el espacio de eventos; No es un número. En otras palabras, , mientras que para un , .X : Ω → R X ∈ { f | f : Ω → R } ω ∈ Ω XXX:Ω→RX∈{f | f:Ω→R}ω∈ΩX(ω)∈R
La notación de expectativa condicional, en mi opinión, es realmente mala, porque es una variable aleatoria en sí misma, es decir, también una función . En contraste, la expectativa (regular) de una variable aleatoria es un número . La expectativa condicional de una variable aleatoria es una cantidad completamente diferente de la expectativa de la misma variable aleatoria, es decir, ni siquiera "chequea" con .E [ ξ ]E[ξ|G]E[ξ]
En otras palabras, usar el símbolo para denotar expectativas tanto regulares como condicionales es un abuso de notación muy grande, lo que lleva a una confusión innecesaria.E
Dicho todo esto, tenga en cuenta que es un número (el valor de la variable aleatoria evaluado en el valor ), pero es una variable aleatoria, pero resulta ser una variable aleatoria constante (es decir, degenerada trivial), porque el álgebra generado por , es trivial / degenerado, y técnicamente hablando, el valor constante de esta variable aleatoria constante es , donde aquíE [ ξ | G ] ω E [ ξ | Ω ] σ Ω { ∅ , Ω } EE[ξ|G](ω)E[ξ|G]ωE[ξ|Ω]σΩ{∅,Ω}EE[ξ]E denota expectativa regular y, por lo tanto, un número, no expectativa condicional y, por lo tanto, no una variable aleatoria.
También parece estar confundido acerca de lo que significa la notación ; técnicamente hablando, solo es posible condicionar en , no en eventos individuales, ya que las medidas de probabilidad solo se definen en completas , no en eventos individuales. Por lo tanto, es solo una abreviatura (perezosa) de , donde representa el generado por el evento , que es . Tenga en cuenta que ; en otras palabras, ,σ - σ - E [ ξ | A ] E [ ξ | σ ( A ) ] σ ( A ) σ - A { ∅ , A , A c , Ω } σ ( A ) = G = σ ( A c )E[ξ|A]σ−σ−E[ξ|A]E[ξ|σ(A)]σ(A)σ−A{∅,A,Ac,Ω}σ(A)=G=σ(Ac)EE[ξ|A]E [ ξ | A c ]E[ξ|G] y son formas diferentes de denotar exactamente el mismo objeto .E[ξ|Ac]
Finalmente, solo quiero agregar que la explicación intuitiva que di arriba explica por qué el valor constante de la variable aleatoria es solo el número - el álgebra representa la menor cantidad posible de información que podríamos tener, de hecho, esencialmente no hay información, por lo que, bajo esta circunstancia extrema, la mejor suposición posible para la cual la variable aleatoria es es la variable aleatoria constante cuyo valor constante es .E [ ξ ] σ - { ∅ , Ω } ξE[ξ|Ω]=E[ξ|σ(Ω)]=E[ξ|{∅,Ω}]E[ξ]σ−{∅,Ω}ξE[ξ]
Tenga en cuenta que todas las variables aleatorias constantes son variables aleatorias, y todas son medibles con respecto a la trivial álgebra , por lo que sí tenemos que la constante aleatoria es la proyección ortogonal de en el subespacio de consiste en variables aleatorias medibles con respecto a , como se afirmó. σ { ∅ , Ω } E [ ξ ] ξ L 2 ( Ω ) { ∅ , Ω }L2σ{∅,Ω}E[ξ]ξL2(Ω){∅,Ω}
Voy a tratar de elaborar lo que sugirió William.
Sea el espacio muestral de lanzar una moneda dos veces. Define la carrera. var. para ser el num. de cabezas que ocurren en el experimento. Claramente, . Una forma de pensar en lo que , como expec. valor, representa es la mejor estimación posible para . Si tuviéramos que adivinar qué valor tomaría , adivinaríamos . Esto se debe a que para cualquier número real .ξ E [ ξ ] = 1 1 ξ ξ 1 E [ ( ξ - 1 ) 2 ] ≤ E [ ( ξ - aΩ ξ E[ξ]=1 1 ξ ξ 1 aE[(ξ−1)2]≤E[(ξ−a)2] a
Denote con como el evento de que el primer resultado es una cabeza. Deje que sea el -alg. gen. por . Pensamos que representa lo que sabemos después del primer lanzamiento. Después del primer lanzamiento, las cabezas ocurrieron o las cabezas no ocurrieron. Por lo tanto, estamos en el evento o después del primer lanzamiento.G = { ∅ , A , A c , Ω } σ A GA={HT,HH} G={∅,A,Ac,Ω} σ A G A cA Ac
Si estamos en el evento , entonces la mejor estimación posible para sería , y si estamos en el evento , entonces la mejor estimación posible para sería .ξ E [ ξ | A ] = 1.5 A c ξ E [ ξA ξ E[ξ|A]=1.5 Ac ξ E[ξ|Ac]=0.5
Ahora defina la carrera. var. para ser ya sea o en función de si o no . Esto corrio. var. , es una mejor aproximación que ya que .1.5 0.5 ω ∈ A η 1 = E [ ξ ] E [ ( ξ - η ) 2 ] ≤ E [ ( ξη(ω) 1.5 0.5 ω∈A η 1=E[ξ] E[(ξ−η)2]≤E[(ξ−1)2]
Lo que está haciendo es proporcionar la respuesta a la pregunta: ¿cuál es la mejor estimación de después del primer lanzamiento? Dado que no conocemos la información después de la primera tirada, dependerá de . Una vez que se nos revela el evento , después del primer lanzamiento, se determina el valor de y proporciona la mejor estimación posible para . ξ η A Gη ξ η A G ξη ξ
El problema con el uso de como su propia estimación, es decir, es el siguiente. no está bien definido después del primer lanzamiento. Digamos que el resultado del experimento es con el primer resultado como cabezas, estamos en el evento , pero ¿qué esNo sabemos desde el primer lanzamiento, que el valor es ambiguo para nosotros, por lo que no está bien definido. Más formalmente, decimos que no es medible, es decir, su valor no está bien definido después del primer lanzamiento. Por lo tanto, es la mejor estimación posible de0 = E [ ( ξ - ξ ) 2 ] ≤ E [ ( ξ - η ) 2 ] ξ ω A ξ ( ω ) = ? ξ ξ G η ξξ 0=E[(ξ−ξ)2]≤E[(ξ−η)2] ξ ω A ξ(ω)=? ξ ξ G η ξ después del primer lanzamiento.
Quizás, alguien aquí pueda encontrar un ejemplo más sofisticado usando el espacio muestral , con , y algunos no triviales álgebra.ξ ( ω ) = ω G σ[0,1] ξ(ω)=ω G σ
fuente
Aunque solicite no utilizar la definición formal, creo que la definición formal es probablemente la mejor manera de explicarla.
Wikipedia - expectativa condicional :
En primer lugar, es una función medible. En segundo lugar, debe coincidir con la expectativa sobre cada (sub) conjunto medible en . Entonces, para un evento, A, el álgebra sigma es , por lo que claramente se establece como especificó en su pregunta para . De manera similar para cualquier variable aleatoria discreta (y combinaciones de ellas), enumeramos todos los eventos primitivos y asignamos la expectativa dada ese evento primitivo.H {A,AC,∅,Ω}ω∈A/AcH H {A,AC,∅,Ω} ω∈A/Ac
Ahora considere lanzar una moneda un número infinito de veces, donde en cada lanzamiento i, obtiene , si su moneda es cruz, entonces sus ganancias totales son donde = 1 para colas y 0 para cabezas. Entonces X es una variable aleatoria real en . Después de n lanzamientos de monedas, conoce el valor de X con precisión 1/2 , por ejemplo, después de 2 lanzamientos de monedas está en [0,1 / 4], [1 / 4,1 / 2], [1/2, 3/4] o [3 / 4,1]: después de cada lanzamiento de moneda, su álgebra sigma asociada se vuelve cada vez más fina, y de manera similar, la expectativa condicional de X se vuelve cada vez más precisa. X = sigma ∞ i = 1 11/2i ci[0,1]1/2nX=∑∞i=112ici ci [0,1] 1/2n
Con suerte, este ejemplo de una variable aleatoria valorada real con una secuencia de álgebras sigma cada vez más finas (Filtración) lo aleja de la intuición puramente basada en eventos a la que está acostumbrado y aclara su propósito.
fuente