¿Son intercambiables los términos función de densidad de probabilidad y distribución de probabilidad (o simplemente "distribución")?

8

Como dice el título, ¿son intercambiables los términos función de densidad de probabilidad y distribución de probabilidad (o simplemente "distribución")? Sí no, ¿Cuál es la diferencia?

pdf
fuente
2
De los dos, en realidad creo que esta es la pregunta mejor planteada en muchos sentidos. Pero como el último de los dos es probablemente el que debería cerrarse.
Silverfish
@Silverfish No solo esta pregunta está mejor planteada que la otra, sino que, en mi opinión, es una pregunta diferente. De hecho, la respuesta (única y aceptada) a la otra pregunta no responde a esta pregunta, excepto quizás en la última oración. Voto para reabrirlo; Quizás puedas unirte a mí en esto. Confesaré que tengo un motivo oculto. Las preguntas cerradas como duplicados rara vez son vistas por la mayoría de las personas, y no quiero haber perdido el tiempo escribiendo una respuesta aquí. Además, es una pena privar a la gente del placer de rechazar mi polémica respuesta.
Dilip Sarwate
@Dilip Si los subprocesos fueran realmente duplicados, los fusionaríamos, lo que daría como resultado que su contribución se convierta en parte del subproceso original. Sin embargo, en este caso, estoy de acuerdo con su afirmación de que la pregunta difiere lo suficiente como para justificar la reapertura de este hilo.
whuber
@Dilip Si esto hubiera permanecido cerrado, un enfoque para aumentar la visibilidad de las respuestas relacionadas pero no idénticas es vincularlo aquí a través de un comentario en la pregunta que se cerraría como un duplicado.
Glen_b -Reinstate Monica
¿Alguien puede publicar aquí un enlace al dup propuesto anteriormente?
kjetil b halvorsen

Respuestas:

5

La frase función de densidad de probabilidad (pdf) significa algo específico: una funciónfX() para una variable aleatoria específica X (para eso está el subíndice, para distinguir esta función de los archivos PDF de otras variables aleatorias) con la propiedad de que para todos los números reales a y b tal que a<b,

P{a<Xb}=abfX(u)du=abfX(v)dv=abfX(t)dt.
Las diferentes integrales están destinadas a servir como un recordatorio de que no importa en lo más mínimo qué símbolo usamos como argumento defX()y que es no el caso (como se lamentablemente demasiado a menudo cree por los que se inician en este tema) que el argumento debe ser la letra minúscula correspondiente a la letra mayúscula que indica la variable aleatoria. También insistimos en que
fX(u)du=1.
Si P{X=α}>0 para algún número real α, entonces X no tiene un pdf, excepto para aquellos que incorporan deltas de Dirac en su cálculo de probabilidad.

La función de distribución de probabilidad acumulativa (cdf o CDF) FX() de X es la función definida como

FX(α)=P{Xα},<α<.
Está relacionado con el pdf (para funciones que tienen un pdf) a través de
FX(α)=αfX(u)du.

=======

Si bien puede haber una definición muy restrictiva de la distribución de probabilidad de la frase en la que algunas personas insisten, el uso coloquial del término abarca ampliamente el pdf y el CDF y el pmf (función de masa de probabilidad que también se llama ddf o función de densidad discreta) y cualquier otra cosa que deseemos incluir como descriptiva del comportamiento probabilístico de una variable aleatoria. Por ejemplo, la frase

la distribución de probabilidad deX es uniforme en (a,b)

casi nunca se interpretará en el sentido de que el CDF de X tiene un valor constante en (a,b) !! Aunque es la distribución la que se dice que es uniforme, todos en su sano juicio tomarán eso como un significado de que la densidad deX tiene valor constante (ba)1 en el intervalo (a,b) (y tiene valor 0en otra parte). Del mismo modo, para "Xse distribuye uniformemente en(a,b)"cuando lo que se quiere decir es que el pdf deX tiene un valor constante en (a,b).

Como otra instancia del uso coloquial de la distribución a la densidad media , considere esta cita de una respuesta publicada recientemente por el Moderador Glen_b.

"Decir el modo implica que la distribución tiene uno y solo uno".

Una densidad puede poseer un modo único, pero un CDF no puede tener un modo único (en los reales no extendidos). Sin embargo, es probable que nadie que lea esa cita piense que Glen_b se refería al CDF cuando escribió "distribución".

Dilip Sarwate
fuente
1
+1, pero tengo algunas reservas sobre el énfasis de los diversos puntos en esta respuesta. El punto final de que un PDF no está definido de forma exclusiva: en realidad es unL1clase de funciones de equivalencia: admite una afirmación diferente de que la "distribución de probabilidad" ni siquiera se refiere coloquialmente al PDF (excepto como un abuso de terminología). Claramente, el CDF, que (sujeto a la restricción cadlag) se define de manera única para todas las variables, es un candidato mucho mejor para ser el referente de "la distribución" de cualquier variable aleatoria.
whuber
1
@whuber Gracias por volver a abrir la pregunta y el voto positivo. He eliminado el material normal de la variable aleatoria y lo reemplacé con una mejor ilustración de por qué "distribución" no siempre significa CDF, pero puede ser un sustituto de la densidad o pdf.
Dilip Sarwate
1
En la edición, presenta un caso muy bueno en nombre de su interpretación del uso coloquial.
whuber
2

En términos de uso común, considere analizar la terminología utilizada en R. La Descripción en la página de ayuda de Distribuciones {stats} dice:

La densidad, la función de distribución acumulativa, la función de cuantiles y la generación de variables aleatorias para muchas distribuciones de probabilidad estándar están disponibles en el paquete de estadísticas.

Para cada una de las distribuciones integradas, proporciona (de acuerdo con las páginas de ayuda individuales) la "densidad" (p. Ej., dnormPara Normal, dbinompara Binomial) y la "función de distribución" (p. Ej. pnorm, pbinomLlamada "función de distribución acumulativa" en la página principal de Distribuciones, como se citó anteriormente).

Entonces, uno podría interpretar que "distribución de probabilidad" describe (quizás un miembro de) una familia de distribuciones, "densidad" puede usarse para distribuciones discretas como el binomio, y la frase "función de distribución" podría preferirse a "distribución" cuando el La función de distribución acumulativa es lo que se pretende.

Alternativamente, uno podría argumentar que el uso común, incluso entre los experimentados, a menudo depende del contexto para mayor claridad.

EdM
fuente
0

No.

  1. La "función de densidad de probabilidad" se utiliza solo para distribuciones continuas. Una distribución discreta no puede tener un pdf (aunque puede aproximarse con un pdf). La "distribución de probabilidad" se usa a menudo para distribuciones discretas, por ejemplo, la distribución binomial.

  2. "distribución de probabilidad" tiene un significado tanto para distribuciones discretas como continuas, pero una distribución de probabilidad es directamente aplicable solo para distribuciones discretas. Cuando la palabra se usa con distribuciones continuas, se refiere a una construcción matemática subyacente como la distribución normal, que para la mayoría de los propósitos debe ser instanciada en una función, típicamente una función de densidad de probabilidad o una función de densidad acumulativa, antes de que pueda aplicarse.

Phil Goetz
fuente
1
"'distribución de probabilidad' generalmente se usa para, y solo está bien definida para, distribución discreta" ¿Quiere decir que, por ejemplo, una distribución normal no es una distribución de probabilidad?
Juho Kokkala
@Kokkala: Si hubiera querido decir eso, simplemente habría dicho que "la distribución de probabilidad" solo debería usarse para distribuciones discretas ". Esas palabras adicionales debían permitir casos en los que las personas llaman, por ejemplo, una distribución normal una distribución de probabilidad. Pero plantea un buen punto: en dominios continuos, la "distribución de probabilidad" todavía se usa, pero para aplicar una distribución de probabilidad, tenemos que usar una instanciación más específica de la misma, como un pdf o un cdf. Así que enmendaré mi respuesta si puedo.
Phil Goetz
1
Existe una definición formal común de "distribución de probabilidad" que entra en conflicto con su punto (2); a saber, la distribución de cualquier variable aleatoria de valor realX está dada por la función XPr(XX). Esto es claramente "directamente aplicable" a todas las distribuciones, no solo a las discretas.
whuber
1
Las modas cambian en esto. La función de masa de probabilidad de expresión se introdujo para hacer que el caso discreto sea completamente distinto, pero a la inversa, muchos escritores explican que la densidad puede definirse en términos de medida de conteo. Todo es una cuestión de la medida subyacente. Entonces no; Los escritores competentes pueden escribir sobre funciones de densidad y tener una definición amplia en mente, no solo la aplicabilidad a variables continuas. El texto de probabilidad intermedia de Peter Whittle es un buen ejemplo.
Nick Cox