¿Por qué una función de distribución acumulativa (CDF) define de forma exclusiva una distribución?

17

Siempre me han dicho que un CDF es único, sin embargo, un PDF / PMF no es único, ¿por qué es eso? ¿Puedes dar un ejemplo donde un PDF / PMF no es único?

DKangeyan
fuente
66
[0,1](0,1) 0 < j 2 - i < 1 i 1 jPr(j2i)=212i0<j2i<1i1j
2
No todas las distribuciones tienen un PDF o un PMF, mientras que mirar el CDF ofrece una visión unificadora de las cosas. Las variables continuas tienen CDF de aspecto suave, las variables discretas tienen una "escalera" y algunas CDF se mezclan.
Silverfish
66
@Silverfish: ... ¡y algunos no son ninguno de los anteriores! :-)
cardenal
3
Para abordar el título (tal vez de manera un poco vaga), el CDF define una distribución porque el CDF (o, de manera equivalente, solo DF / 'función de distribución'; la "C" actúa solo para aclarar que ese es el objeto del que estamos hablando) es el término 'distribución' literalmente se refiere a; la "D" es la clave de esa parte. Que es único se deduce de la "F": las funciones tienen un solo valor, por lo que si dos funciones de distribución son idénticas, el objeto que definen es el mismo; si los DF diferieran en alguna parte, la definición de lo que son sería diferente en esos puntos. ¿Eso es tautología? Creo que es.
Glen_b: reinstala a Monica
44
@Glen_b Es tautológico solo para la intuición entrenada. Una función de distribución F solo da probabilidades de la forma F(x)=Pr{ωΩ|X(ω)x} mientras que la distribución completa especifica las probabilidades de la forma Pr({ωΩ|X(ω)B} para conjuntos medibles arbitrarios BR mostrar que F determina la distribución. Como señala NicholasB, se trata de extender una medida previa desde un semianillo (de intervalos medio abiertos), μ((a,b])=F(b)F(a) , a la sigma-Lebesgue campo completo y mostrando que es único.
whuber

Respuestas:

13

Recordemos algunas cosas. Dejar que sea un espacio de probabilidad , es nuestra muestra, es nuestro álgebra, y es una función de probabilidad definida sobre . Una variable aleatoria es una función medible es decir, para cualquier subconjunto medible de Lebesgue en . Si no está familiarizado con este concepto, todo lo que diga después no tendrá ningún sentido.Ω A σ P A X : Ω R X - 1 ( S ) A R(Ω,A,P)ΩAσPAX:ΩRX1(S)AR

Cada vez que tenemos una variable aleatoria, , induce una medida de probabilidad en por el impulso categórico. En otras palabras, . Es trivial comprobar que es una medida de probabilidad en . Hacemos un llamado la distribución de .X R X ( S ) = P ( X - 1 ( S ) ) X RX:ΩRXRX(S)=P(X1(S))XRXX

Ahora relacionado con este concepto hay algo llamado la función de distribución de una variable de función. Dada una variable aleatoria definimos . Las funciones de distribución tienen las siguientes propiedades:X:ΩRF(x)=P(Xx)F:R[0,1]

  1. F es derecho-continuo .

  2. F no es decreciente

  3. F()=1 y .F()=0

Claramente, las variables aleatorias que son iguales tienen la misma distribución y función de distribución.

Revertir el proceso y obtener una medida con la función de distribución dada es bastante técnico. Digamos que se le asigna una función de distribución . Defina . Debe demostrar que es una medida en el semi-álgebra de intervalos de . Luego puede aplicar el Carathéodory teorema de extensión para extender a una medida de probabilidad en .F(x)μ(a,b]=F(b)F(a)μ(a,b]μR

Nicolas Bourbaki
fuente
44
Este es un buen comienzo para una respuesta, pero puede estar ocultando involuntariamente un poco el asunto en cuestión. El problema principal parece estar mostrando que dos medidas con la misma función de distribución son, de hecho, iguales. Esto no requiere nada más que teorema - de Dynkin y el hecho de que los conjuntos de la forma forman un sistema que genera el álgebra de Borel . Luego, la falta de uniformidad de una densidad (suponiendo ¡existe!) se puede abordar y contrastar con lo anterior.πλ(,b]πσ
cardenal
3
(Una objeción menor adicional: las variables aleatorias generalmente se definen en términos de conjuntos de Borel en lugar de conjuntos de Lebesgue). Creo que con algunas ediciones menores esta respuesta será bastante clara. :-)
cardenal
@cardinal Pienso primero en el análisis, la probabilidad en segundo lugar. Por lo tanto, esto puede explicar por qué prefiero pensar en conjuntos de Lebesgue. En cualquier caso, no afecta lo que se dijo.
Nicolas Bourbaki
4

Para responder a la solicitud de un ejemplo de dos densidades con la misma integral (es decir, tener la misma función de distribución) considere estas funciones definidas en los números reales:

 f(x) = 1 ; when x is odd integer
 f(x) = exp(-x^2)  ; elsewhere

y entonces;

 f2(x) = 1  ; when x is even integer
 f2(x) = exp(-x^2) ;  elsewhere

No son iguales en absoluto x, pero ambas son densidades para la misma distribución, por lo tanto, las densidades no están determinadas únicamente por la distribución (acumulativa). Cuando las densidades con un dominio real son diferentes solo en un conjunto contable de valores x, entonces las integrales serán las mismas. El análisis matemático no es realmente para el corazón débil o la mente decididamente concreta.

DWin
fuente
0

No estoy de acuerdo con la afirmación, "la función de distribución de probabilidad no determina únicamente una medida de probabilidad", que usted dice en su pregunta inicial. Lo determina de manera única.

Sea dos funciones de masa de probabilidad. Si, E f 1 = E f 2 Para cualquier conjunto medible E, entonces f 1 = f 2 en casi todas partes. Esto determina de manera única el pdf (porque en el análisis no nos importa si no están de acuerdo con un conjunto de medida cero).f1,f2:R[0,)

Ef1=Ef2
Ef1=f2

Podemos reescribir la integral anterior en, Donde g = f 1 - f 2 es una función integrable.

Eg=0
g=f1f2

Definir , entonces E g = 0 . Utilizamos el conocido teorema de que si una integral de una función no negativa es cero, entonces la función es cero en casi todas partes. En particular, g = 0 ae en E . Así f 1 = f 2 ae en E . Ahora repita el argumento en la otra dirección con F = { x R | g 0 }E={xR | g0}Eg=0g=0Ef1=f2EF={xR | g0}. Vamos a conseguir que la ae en F . Por lo tanto, f 1 = f 2 ae en E F = R .f1=f2Ff1=f2EF=R

Nicolas Bourbaki
fuente