¿El pdf y el pmf y el cdf contienen la misma información?

17

¿El pdf y el pmf y el cdf contienen la misma información?

Para mí, el pdf da toda la probabilidad a un cierto punto (básicamente el área bajo la probabilidad).

Las pmf dan la probabilidad de cierto punto.

El cdf da la probabilidad bajo cierto punto.

Entonces, para mí, el pdf y el cdf tienen la misma información, pero el pmf no, porque da la probabilidad de un punto xen la distribución.

Kare
fuente

Respuestas:

25

Cuando se hace una distinción entre función de probabilidad y densidad *, el pmf se aplica solo a variables aleatorias discretas, mientras que el pdf se aplica a variables aleatorias continuas.

* los enfoques formales pueden abarcar ambos y usar un solo término para ellos

El cdf se aplica a cualquier variable aleatoria, incluidas las que no tienen ni pdf ni pmf.

ingrese la descripción de la imagen aquí

(Una distribución mixta no es el único caso de una distribución que no tiene un pdf o pmf, pero es una situación razonablemente común; por ejemplo, considere la cantidad de lluvia en un día o la cantidad de dinero pagada en reclamos por una póliza de seguro de propiedad, cualquiera de las cuales podría ser modelada por una distribución continua inflada a cero)

El cdf para una variable aleatoria da P ( X x )XP(Xx)

El pmf para una variable aleatoria discreta , da P ( X = x ) .XP(X=x)

El pdf en sí mismo no da probabilidades , sino probabilidades relativas; Las distribuciones continuas no tienen probabilidades puntuales. Para obtener probabilidades de los archivos PDF, debe integrarse en algún intervalo, o tomar una diferencia de dos valores de PDF.

Es difícil responder la pregunta '¿contienen la misma información' porque depende de lo que quieras decir? Puede ir de pdf a cdf (a través de la integración), y de pmf a cdf (a través de la suma), y de cdf a pdf (a través de la diferenciación) y de cdf a pmf (a través de la diferenciación), por lo que si existe un pmf o un pdf, contiene la misma información que el cdf.

Glen_b -Reinstate a Monica
fuente
1
Glen, ¿podrías ayudarme proporcionando alguna referencia donde pudiera leer sobre "pdf dando probabilidades relativas"? Es muy interesante y no recuerdo haberlo visto en mis libros. Gracias.
Alecos Papadopoulos
@Alecos Es simplemente una explicación (quizás mal redactada) del hecho de que mientras no es una probabilidad, ya que f ( xf(x) es la probabilidad de estar en ( x , x + d x ) , entonces f ( xf(x)dx(x,x+dx) puede considerarse como la razón de la probabilidad de que una variable con densidad f esté dentro de una distancia muy pequeña de x a la razón de que una variable con densidad g está en el mismo intervalo. En ese sentido, expresa 'probabilidad relativa'. f(x)/g(x)fxg
Glen_b -Reinstate Monica
Veo. Ciertamente es válido como una aproximación de la razón de probabilidades, y ciertamente presente en funciones de densidad empírica, donde las cosas son discretas por necesidad.
Alecos Papadopoulos
10

Los PMF están asociados con variables aleatorias discretas, PDF con variables aleatorias continuas. Para cualquier tipo de variable aleatoria o aleatoria, el CDF siempre existe (y es único), definido como Ahora, dependiendo del conjunto de soporte de la variable aleatoria X , la densidad (o función de masa) no necesita existir. (Considere el conjunto de Cantor y la función de Cantor , el conjunto se define de forma recursiva eliminando el centro 1/3 del intervalo de la unidad, luego repite el procedimiento para los intervalos (0, 1/3) y (2/3, 1), etc. La función se define como C ( x

FX(x)=P{Xx}.
X , si x está en el conjunto de Cantor, y el límite inferior más grande en el conjunto de Cantor si x no es un miembro.) La función de Cantor es una función de distribución perfectamente buena, si agrega C ( x ) =C(x)=xxx si x < 0 y C ( x ) = 1 si 1 < x . Pero este cdf no tiene densidad: C ( x ) es continua en todas partes, pero su derivada es 0 en casi todas partes. Sin densidad con respecto a ninguna medida útil.C(x)=0x<0C(x)=11<xC(x)

Entonces, la respuesta a su pregunta es, si existe una función de densidad o masa, entonces es una derivada del CDF con respecto a alguna medida. En ese sentido, llevan la "misma" información. PERO, los PDF y los PMF no tienen que existir. Los CDF deben existir.

Dennis
fuente
2
Dennis, ¿puedes aclarar lo que quieres decir con la frase " Sin densidad con respecto a ninguna medida "? Ciertamente tiene una densidad (¡uniforme!) Con respecto a sí mismo.
cardenal
@cardinal: Lo intentaré, pero no sé si tendrá sentido a menos que hayas estudiado un análisis real. Si observa algunos libros antiguos sobre estadística matemática (por ejemplo, Estadística matemática de Freund ), verá los PMF denominados "densidades". El nombre "densidad" se justifica por la medida de probabilidad en el espacio medibleμ es la base del CDF (ver el comentario de Joel). La densidad es la derivada de Radon-Nikodym de μ con respecto a alguna medida (generalmente medida de Lesbesgue o medida de conteo). En este caso, C ( x )(Ω,σ(Ω),μ)μC(x)no tiene derivado RN.
Dennis
3
@cardinal (continuación): La medida de probabilidad es uniforme en el conjunto de Cantor, pero esta es una bestia tan extraña que ni siquiera estoy seguro de cómo se ve el álgebra . Quizás debería haber dicho: "No hay densidad con respecto a ninguna medida útil". σ
Dennis
2

Las otras respuestas apuntan al hecho de que los CDF son fundamentales y deben existir, mientras que los PDF y PMF no son y no necesariamente existen.

S1

Me parece que la respuesta es que la función fundamental es la medida de probabilidad , que asigna cada subconjunto (considerado) del espacio muestral a una probabilidad. Luego, cuando existen, el CDF, PDF y PMF surgen de la medida de probabilidad.

Joel Bosveld
fuente
1
Como lo he visto, la mayoría de los libros de texto definen "variable aleatoria" como un mapeo desde un espacio muestral a los números reales. Esencialmente, una "variable aleatoria" tiene un valor real.
Neil G
1
(R,B,F)(Ω,σ(Ω),μ)Ωμ
FX(x)=μ{ω|X(ω)x}.