¿Por qué necesitamos álgebras sigma para definir espacios de probabilidad?

122

Tenemos un experimento aleatorio con diferentes resultados que forman el espacio muestral Ω, en la que miramos con interés en ciertos patrones, llamados eventos F. Las álgebras sigma (o campos sigma) están formadas por eventos a los que se puede asignar una medida de probabilidad PSe cumplen ciertas propiedades, incluida la inclusión del conjunto nulo y todo el espacio muestral, y un álgebra que describe uniones e intersecciones con diagramas de Venn.

La probabilidad se define como una función entre el álgebra σ y el intervalo [0,1] . En total, el triple (Ω,F,P) forma un espacio de probabilidad .

¿Podría alguien explicar en inglés simple por qué el edificio de probabilidad se derrumbaría si no tuviéramos un álgebra σ ? Simplemente están encajados en el medio con esa imposiblemente caligráfica "F". Confío en que sean necesarios; Veo que un evento es diferente de un resultado, pero ¿qué podría salir mal sin una σ álgebras?

La pregunta es: ¿en qué tipo de problemas de probabilidad la definición de un espacio de probabilidad que incluye un álgebra σ convierte en una necesidad?


Este documento en línea en el sitio web de la Universidad de Dartmouth proporciona una explicación accesible en inglés. La idea es un puntero giratorio que gira en sentido antihorario en un círculo de perímetro unitario :

ingrese la descripción de la imagen aquí

Comenzamos construyendo una ruleta, que consiste en un círculo de circunferencia unitaria y un puntero como se muestra en [la] Figura. Escogemos un punto en el círculo y lo etiquetamos como 0 , y luego etiquetamos cualquier otro punto en el círculo con la distancia, digamos x , de 0 a ese punto, medida en sentido antihorario. El experimento consiste en girar el puntero y registrar la etiqueta del punto en la punta del puntero. Dejamos que la variable aleatoria X denote el valor de este resultado. El espacio muestral es claramente el intervalo [0,1). Nos gustaría construir un modelo de probabilidad en el que cada resultado sea igualmente probable que ocurra. Si procedemos como lo hicimos para [...] experimentos con un número finito de resultados posibles, entonces debemos asignar la probabilidad 0 a cada resultado, ya que de lo contrario, la suma de las probabilidades, sobre todos los resultados posibles, no igual 1. (De hecho, sumar un número incontable de números reales es un asunto complicado; en particular, para que dicha suma tenga algún significado, a lo sumo, muchos de los sumandos pueden ser diferentes de 0 ). Sin embargo, si todas las probabilidades asignadas son 0 , entonces la suma es 0 , no 1 , como debería ser.

Entonces, si asignamos a cada punto alguna probabilidad, y dado que hay un número infinito (incontable) de puntos, su suma se sumaría a >1 .

Antoni Parellada
fuente
99
¡Parece contraproducente pedir respuestas sobre los campos que no mencionan la teoría de la medida! σ
Xi'an
55
Sin embargo, lo hice ... No estoy seguro de entender tu comentario.
Antoni Parellada
8
Seguramente la necesidad de campos sigma no es solo una cuestión de opinión ... Creo que esto se puede considerar en el tema aquí (en mi opinión).
Gung
8
Si su necesidad de teoría de la probabilidad se limita a "caras" y "colas", ¡entonces claramente no hay necesidad de campos ! σ
Xi'an
26
Creo que esta es una buena pregunta. Muy a menudo se ven en los libros de texto referencias completamente superfluas a triples de probabilidad que el autor luego ignora por completo a partir de entonces. (Ω,F,P)
dsaxton

Respuestas:

124

Para el primer punto de Xi'an: cuando estás hablando de álgebras , estás preguntando sobre conjuntos medibles, por lo que desafortunadamente cualquier respuesta debe centrarse en la teoría de la medida. Sin embargo, intentaré construirlo suavemente.σ

Una teoría de probabilidad que admite todos los subconjuntos de conjuntos incontables romperá las matemáticas

R2

Pero, ¿qué sucede si el área del conjunto de intereses no está bien definida?

P(A)=1P(A)=00=15<0

σ

σFσ

σσ

  1. Cierre bajo uniones contables.
  2. Cierre bajo intersecciones contables.
  3. Cierre bajo complementos.

P(A)=2/3P(Ac)1/3P(Ac)P(AAc)=P(A)+1P(A)=1

ΩΩF

σ

σF=2ΩΩΩ2Ω

RnσLnLnn=1,2,3el mismo evento basado en alguna otra prueba.

σ

F=All subsets of the unit square with defined L2 measure.
Bss(0,1)(0,0)FB

Entonces, como cuestión práctica, simplemente hacer esa observación a menudo es suficiente para hacer la observación de que solo considera conjuntos medibles de Lebesgue para avanzar en el problema de interés.

Pero espera, ¿qué es un conjunto no medible?

Me temo que solo puedo arrojar un poco de luz sobre esto. Pero la paradoja de Banach-Tarski (a veces la paradoja del "sol y guisante") puede ayudarnos a algunos:

Dada una bola sólida en un espacio tridimensional, existe una descomposición de la bola en un número finito de subconjuntos disjuntos, que luego se pueden volver a unir de una manera diferente para producir dos copias idénticas de la bola original. De hecho, el proceso de reensamblaje implica solo mover las piezas y rotarlas, sin cambiar su forma. Sin embargo, las piezas en sí no son "sólidos" en el sentido habitual, sino dispersiones infinitas de puntos. La reconstrucción puede funcionar con tan solo cinco piezas.

Una forma más fuerte del teorema implica que, dados dos objetos sólidos "razonables" (como una bola pequeña y una bola enorme), uno puede volver a ensamblarse en el otro. Esto a menudo se afirma informalmente como "un guisante se puede cortar y volver a ensamblar en el Sol" y se llama la "paradoja del guisante y el Sol". 1

R3SΩSV(S)>V(Ω)P(S)>1

Para resolver esta paradoja, uno podría hacer una de las cuatro concesiones:

  1. El volumen de un conjunto puede cambiar cuando se gira.
  2. El volumen de la unión de dos conjuntos disjuntos puede ser diferente de la suma de sus volúmenes.
  3. Los axiomas de la teoría de conjuntos de Zermelo – Fraenkel con el axioma de elección (ZFC) podrían tener que modificarse.
  4. Algunos conjuntos pueden etiquetarse como "no medibles", y uno necesitaría verificar si un conjunto es "medible" antes de hablar sobre su volumen.

σ

Sycorax
fuente
55
L
77
σ
2
@ Xi'an Gracias por las palabras amables! Realmente significa mucho, viniendo de ti. No estaba familiarizado con la paradoja de Borel-Kolmogorov al momento de escribir este artículo, pero leeré un poco y veré si puedo hacer una adición útil de mis hallazgos.
Sycorax
3
@ Student001: Creo que estamos dividiendo pelos aquí. Tiene razón en que la definición general de "medida" (cualquier medida) se da utilizando el concepto de álgebras sigma. Sin embargo, mi punto es que no hay una palabra o concepto de "sigma-álgebra" en la definición de la medida de Lebesgue proporcionada en mi primer enlace. En otras palabras, uno puede definir la medida de Lebesgue según mi primer enlace, pero luego uno debe demostrar que es una medida y esa es la parte difícil. Sin embargo, estoy de acuerdo en que deberíamos detener esta discusión.
ameba
3
Realmente disfruté leyendo tu respuesta. No sé cómo agradecerte, ¡pero has aclarado muchas cosas! Nunca estudié análisis real ni tuve una introducción adecuada a las matemáticas. Proviene de una formación en ingeniería eléctrica que se centró mucho en la implementación práctica. Lo has escrito en términos tan simples que un tipo como yo podría entenderlo. Realmente aprecio su respuesta y la simplicidad que ha brindado. ¡También gracias a @ Xi'an por sus comentarios!
Zushauque
19

[0,18),[18,25),[25,34),(Ω,F)F[18,25)[20,30)[20,30)F

(Ω,F)f:f1(1)Ff

FFABABAB. Ahora, exigir el cierre de intersecciones y uniones contables nos permite pedir conjunciones o disyunciones contables. Y, negar una pregunta está representado por el conjunto complementario. Eso nos da un álgebra sigma.

Vi este tipo de introducción primero en el muy buen libro de Peter Whittle "Probabilidad a través de la expectativa" (Springer).

EDITAR

iiσσnσnσ

¿Pero realmente necesitamos la ley fuerte de los grandes números? Según una respuesta aquí , tal vez no.

nn

σ

kjetil b halvorsen
fuente
44
σP(A)[20,30)P(A)[20,30)P(A)[18,34)bien definido, por lo que ni siquiera está claro que este ejemplo ilustre lo que quieres que haga.
Sycorax
55
σσ
2
σ
3
Creo que tu argumento es sólido. Sin embargo, me sorprendió un poco al final cuando me encontré con esta afirmación: "exigir el cierre de las intersecciones y uniones contables nos permite pedir conjunciones o disyunciones contables". Esto parece llegar al meollo del problema: ¿por qué alguien querría construir un evento tan infinitamente complicado? Una buena respuesta a eso haría que el resto de tu publicación sea más persuasiva.
whuber
2
Re usos prácticos: la teoría de probabilidad y medida utilizada en las matemáticas de las finanzas (incluyendo ecuaciones diferenciales estocásticas, integrales Ito, filtraciones de álgebras, etc.) parece que sería imposible sin álgebras sigma. (¡No puedo votar las ediciones porque ya voté tu respuesta!)
whuber
2

σ

σAB(AB)C

El primer axioma es que ∅, 𝑋∈𝜎. Bueno, SIEMPRE sabes la probabilidad de que nada suceda (0) o que algo suceda (1).

El segundo axioma se cierra bajo complementos. Déjame ofrecerte un estúpido ejemplo. Nuevamente, considere un lanzamiento de moneda, con 𝑋 = {𝐻, 𝑇}. Imagina que te digo que el álgebra 𝜎 para este cambio es {∅, 𝑋, {𝐻}}. Es decir, sé la probabilidad de que NADA suceda, de que algo suceda y de un cara, pero NO sé la probabilidad de una cola. Con razón me llamarías un imbécil. ¡Porque si conoces la probabilidad de un cara, automáticamente sabrás la probabilidad de una cruz! Si conoce la probabilidad de que algo suceda, ¡sabe la probabilidad de que NO suceda (el complemento)!

El último axioma está cerrado bajo uniones contables. Déjame darte otro estúpido ejemplo. Considere la tirada de un dado, o 𝑋 = {1,2,3,4,5,6}. ¿Qué pasaría si te dijera que el 𝜎 álgebra para esto es {∅, 𝑋, {1}, {2}}. Es decir, sé la probabilidad de sacar un 1 o sacar un 2, pero no sé la probabilidad de sacar un 1 o un 2. Nuevamente, me llamarías un idiota justificadamente (espero que la razón sea clara). Lo que sucede cuando los conjuntos no son disjuntos, y lo que sucede con innumerables sindicatos es un poco más complicado, pero espero que puedan tratar de pensar en algunos ejemplos.

σ

Bueno, no es un caso completamente limpio, pero hay algunas razones sólidas por las cuales .

¿Por qué los probabilistas necesitan medidas?

σσP

La gente trae el set de Vitali y Banach-Tarski para explicar por qué necesitas la teoría de la medición, pero creo que eso es engañoso . El conjunto de Vitali solo desaparece para las medidas (no triviales) que son invariantes a la traducción, que los espacios de probabilidad no requieren. Y Banach-Tarski requiere rotación-invariancia. La gente de análisis se preocupa por ellos, pero los probabilistas en realidad no .

La razón de ser de la teoría de la medida en la teoría de la probabilidad es unificar el tratamiento de RV discretos y continuos y, además, permitir RV mezclados y RV que simplemente no son ninguno.

Yatharth Agarwal
fuente
σσ