¿Por qué las variables aleatorias se definen como funciones?

21

Tengo problemas para entender el concepto de una variable aleatoria como función. Entiendo la mecánica (creo) pero no entiendo la motivación ...

Digamos que es un triple de probabilidad, donde , es el álgebra de Borel- en ese intervalo y es la medida regular de Lebesgue. Sea una variable aleatoria de a tal que , , ..., , por lo que tiene una distribución uniforme discreta en los valores del 1 al 6. Ω = [ 0 , 1 ] B σ P X B { 1 , 2 , 3 , 4 , 5 , 6 } X ( [ 0 , 1 / 6 ) ) = 1 X ( [ 1 / 6 , 2 / 6 ) ) = 2 X ( [(Ω,B,P)Ω=[0,1]BσPXB{1,2,3,4,5,6}X([0,1/6))=1X([1/6,2/6))=2XX([5/6,1])=6X

Eso está bien, pero no entiendo la necesidad del triple de probabilidad original ... podríamos haber construido directamente algo equivalente como donde es todo el álgebra apropiado del espacio, y es una medida que asigna a cada subconjunto la medida (# de elementos) / 6. Además, la elección de fue arbitraria; podría haber sido , o cualquier otro conjunto.S σ P x Ω = [ 0 , 1 ] [ 0 , 2 ]({1,2,3,4 4,5 5,6 6},S,PAGSX)SσPAGSXΩ=[0 0,1][0 0,2]

Entonces mi pregunta es, ¿por qué molestarse en construir un arbitrario con un álgebra y una medida, y definir una variable aleatoria como un mapa desde el álgebra hasta la línea real? σ σΩσσ

Leo Vasquez
fuente
55
Tenga en cuenta que la variable aleatoria es la función de Ω a , no desde a . El requisito es que la variable aleatoria sea medible con respecto a . B R BRsiRsi
mpiktas

Respuestas:

21

Si se pregunta por qué se usa toda esta maquinaria cuando algo más simple podría ser suficiente, tiene razón, para las situaciones más comunes. Sin embargo, la versión teórica de la medida de probabilidad fue desarrollada por Kolmogorov con el propósito de establecer una teoría de tal generalidad que pudiera manejar, en algunos casos, espacios de probabilidad muy abstractos y complicados. De hecho, los fundamentos teóricos de la medida de Kolmogorov para la probabilidad finalmente permitieron que las herramientas probabilísticas se aplicaran mucho más allá de su dominio original de aplicación en áreas como el análisis armónico.

Al principio parece más sencillo omitir cualquier álgebra Ω "subyacente" , y simplemente asignar masas de probabilidad a los eventos que comprenden el espacio muestral directamente, como usted ha propuesto. De hecho, los probabilistas efectivamente hacen lo mismo cuando eligen trabajar con la "medida inducida" en el espacio muestral definido por P X - 1 . Sin embargo, las cosas comienzan a complicarse cuando comienzas a entrar en espacios dimensionales infinitos. Suponga que desea probar la Ley fuerte de los números grandes para el caso específico de lanzar monedas justas (es decir, que la proporción de caras tiende arbitrariamente a 1/2 a medida que el número de monedas se lanza al infinito). Podrías intentar construir un σσΩPAGSX-1σ-algebra en el conjunto de secuencias infinitas de la forma . Pero aquí podemos encontrar que es mucho más conveniente tomar el espacio subyacente como Ω = [ 0 , 1 ) ; y luego use las representaciones binarias de números reales (por ejemplo, 0.10100 ... ) para representar secuencias de lanzamientos de monedas (1 siendo caras, 0 siendo colas). Una ilustración de este mismo ejemplo se puede encontrar en los primeros capítulos de Probabilidad de Billingsley y medir .(H,T,H,...)Ω=[0 0,1)0.10100 ...

charles.y.zheng
fuente
¡Gracias! Revisaré ese libro. Sin embargo, dado que el todavía es arbitrario (podría ser [ 0 , 2 ) en su ejemplo, es el intervalo de unidad [ 0 , 1 ] o [ 0 , 1 ) el espacio 'preferido' que funcionará en todas las circunstancias ? ¿O hay situaciones en las que un Ω más complicado , como R 2 , sería beneficioso? Ω[0 0,2)[0 0,1][0 0,1)ΩR2
Leo Vasquez
2
@Leo: Sí Los procesos estocásticos de tiempo continuo proporcionan un ejemplo. El ejemplo canónico es el movimiento browniano, donde el espacio muestral se toma como C , el espacio de todas las funciones continuas de valor real. Ωdo
Cardenal
1
@NRH, sí, debería haber dicho que se puede tomar en lugar de tomar . Estaba (con cierto propósito) tratando de cepillar eso debajo de la alfombra.
cardenal
1
@cardinal, en el comentario de @ Leo se preguntó si es 'preferido' en todas las circunstancias. Solo digo que en IMO no existe tal Ω y que es beneficioso no requerir nada sobre Ω en general. Cuando desee trabajar con un ejemplo específico, puede haber razones para elegir un Ω específico . Tenga en cuenta, sin embargo, que la "tautología" está arrasando debajo de la alfombra que la existencia del movimiento browniano como una medida de probabilidad en C debe establecerse. [0,1]ΩΩΩC
NRH
2
@NRH, perdón por mi lentitud mental hoy. No pude conectar la referencia preferida al comentario anterior de @ Leo. Gracias. Con respecto a la observación de "tautología", mi punto era que en otras construcciones, la continuidad de las rutas de muestra es un teorema , mientras que, bajo la construcción basada en con el mapa de identidad, es tautológica. Por supuesto, primero debe demostrarse el hecho de que BM puede construirse de esta manera. Pero, eso es un poco fuera de lugar. C
cardenal
10

Los problemas con respecto a las álgebras son sutilezas matemáticas, que realmente no explican por qué o si necesitamos un espacio de fondo . De hecho, diría que no hay evidencia convincente de que el espacio de fondo sea una necesidad. Para cualquier configuración probabilística ( E , E , μ ) donde E es el espacio muestral, E el σ- álgebra y μ una medida de probabilidad, el interés está en μ , y no hay razón abstracta de que queramos que μ sea ​​la medida de la imagen de un mapa medible X : ( Ω , Bσ(E,E,μ)EEσμμμ .X:(Ω,B)(E,E)

Sin embargo, el uso de un espacio de fondo abstracto brinda conveniencia matemática que hace que muchos resultados parezcan más naturales e intuitivos. El objetivo es siempre decir algo sobre , la distribución de X , pero puede ser más fácil y más claramente expresado en términos de X .μXX

Un ejemplo es el teorema del límite central. Si son valores reales con media μ y varianza σ 2, el CLT dice que P ( X1,,Xnμσ2 dondeΦes la función de distribución para la distribución normal estándar. Si la distribución deXiesμ,el resultado correspondiente en términos de la medida lee ρ

P(nσ(1ni=1nXiξ)x)Φ(x)
ΦXiμ Se necesita alguna explicación de la terminología. Porμnqueremos decir lan-veces convolución deμ(la distribución de la suma). Las funcionesρcson las funciones linealesρc(x)=cxy
ρn/στξρ1/n(μn)((,x])Φ(x)
μnnμρcρc(x)=cx es la traducción τ ξ ( x ) = x - ξ . Probablemente uno podría acostumbrarse a la segunda formulación, pero hace un buen trabajo al ocultar de qué se trata.τξτξ(x)=xξ

Lo que parece ser el problema es que las transformaciones aritméticas involucradas en el CLT se expresan con bastante claridad en términos de variables aleatorias, pero no se traducen tan bien en términos de las medidas.

NRH
fuente
(+1) Buena descripción. Creo que la otra razón por la que la notación anterior es tan popular es que se traduce más naturalmente en nociones intuitivas en las aplicaciones. (Votado hace varias horas.)
cardenal
@cardinal, gracias por aclarar ese punto. Parece más natural pensar y discutir en términos de una suma de variables, no una convolución de medidas de probabilidad, y nos gustaría que las matemáticas reflejen eso.
NRH
0

Recientemente me topé con esta nueva forma de pensar sobre la Variable aleatoria , así como sobre el espacio de fondo Ω . No estoy seguro de si esta es la pregunta que estaba buscando, ya que no es una razón matemática, pero creo que proporciona una forma muy clara de pensar en los vehículos recreativos.XΩ

Imagine una situación en la que arrojamos una moneda. Esta configuración experimental consiste en un conjunto de posibles condiciones iniciales que incluyen la descripción física de cómo se lanza la moneda. El espacio de fondo consta de todas esas posibles condiciones iniciales. Por simplicidades, podríamos suponer que los lanzamientos de monedas solo varían en velocidad, luego estableceríamos Ω=[0,vmax]

La variable aleatoria puede considerarse como una función que mapea cada estado inicial ω Ω con el resultado correspondiente del experimento, es decir, si es cruz o cabeza.XωΩ

Para el RV: la medida Q correspondería a la medida de probabilidad sobre las condiciones iniciales, que junto con la dinámica del experimento representado por XX:([0,vmax],B[0,vmax],Q)({0,1},2{0,1})QX determina la distribución de probabilidad sobre los resultados.

Para referencia de esta idea, puede consultar los capítulos de Tim Maudlin o Micheal Strevens en "Probabilties in Physics" (2011)

Sebastian
fuente