Por lo general, una distribución de probabilidad sobre variables discretas se describe utilizando una función de masa de probabilidad (PMF):
Cuando trabajamos con variables aleatorias continuas, describimos distribuciones de probabilidad usando una función de densidad de probabilidad (PDF) en lugar de una función de masa de probabilidad.
- Aprendizaje profundo de Goodfellow, Bengio y Courville
Sin embargo, Wolfram Mathworld está utilizando PDF para describir la distribución de probabilidad sobre variables discretas:
¿Es esto un error? o no importa mucho?
Respuestas:
No es un error: en el tratamiento formal de la probabilidad, a través de la teoría de la medida, una función de densidad de probabilidad es un derivado de la medida de probabilidad de interés, tomada con respecto a una "medida dominante" (también llamada "medida de referencia"). Para distribuciones discretas sobre los enteros, la función de masa de probabilidad es una función de densidad con respecto a la medida de conteo . Dado que una función de masa de probabilidad es un tipo particular de función de densidad de probabilidad, a veces encontrará referencias como esta que se refieren a ella como una función de densidad, y no están equivocados al referirse a ella de esta manera.
En el discurso ordinario sobre probabilidad y estadística, a menudo se evita esta terminología y se distingue entre "funciones de masa" (para variables aleatorias discretas) y "funciones de densidad" (para variables aleatorias continuas), para distinguir distribuciones discretas y continuas. En otros contextos, donde se establecen aspectos holísticos de probabilidad, a menudo es mejor ignorar la distinción y referirse a ambos como "funciones de densidad".
fuente
treatment
"En el tratamiento formal de la probabilidad" significa notación, perspectiva, convención u otra cosa?Además de la respuesta más teórica en términos de teoría de la medida, también es conveniente no distinguir entre pmfs y pdf en la programación estadística. Por ejemplo, R tiene una gran cantidad de distribuciones incorporadas. Para cada distribución, tiene 4 funciones. Por ejemplo, para la distribución normal (del archivo de ayuda):
Los usuarios de R se acostumbran rápidamente a los
d,p,q,r
prefijos. Sería molesto si tuviera que hacer algo como soltard
y usar,m
por ejemplo, para la distribución binomial. En cambio, todo es como un usuario R esperaría:fuente
scipy.stats
distingue, algunos objetos tienen unpdf
método y otros tienen unpmf
método. ¡Realmente me molesta!