¿Wolfram Mathworld comete un error al describir una distribución de probabilidad discreta con una función de densidad de probabilidad?

14

Por lo general, una distribución de probabilidad sobre variables discretas se describe utilizando una función de masa de probabilidad (PMF):

Cuando trabajamos con variables aleatorias continuas, describimos distribuciones de probabilidad usando una función de densidad de probabilidad (PDF) en lugar de una función de masa de probabilidad.

- Aprendizaje profundo de Goodfellow, Bengio y Courville

Sin embargo, Wolfram Mathworld está utilizando PDF para describir la distribución de probabilidad sobre variables discretas:

ingrese la descripción de la imagen aquí

¿Es esto un error? o no importa mucho?

czlsws
fuente
55
Eso es descuidado, en mi opinión, pero no muy importante. Incluso es defendible si se acercan a la probabilidad desde el punto de vista de la teoría de la medida, aunque eso parece demasiado para una introducción al lanzamiento de una moneda. (Bastante extraño, no parecen tener un artículo sobre PMF).
Dave,
99
un pmf es una densidad contra la medida de conteo
Xi'an
3
Cuando se discute la teoría de probabilidad en el nivel del espacio de medida especificado por 3 elementos, pdf y pmf no tienen diferencias, por lo que se descarta pmf. Todas las distribuciones se pueden especificar por pdf. Wolfram es un sitio web de matemáticas, por lo que no es sorprendente que usen matemáticas de alto nivel para hablar de probabilidad. Aquí hay una buena lectura gratuita. stat.washington.edu/~pdhoff/courses/581/LectureNotes/…
user158565

Respuestas:

30

No es un error: en el tratamiento formal de la probabilidad, a través de la teoría de la medida, una función de densidad de probabilidad es un derivado de la medida de probabilidad de interés, tomada con respecto a una "medida dominante" (también llamada "medida de referencia"). Para distribuciones discretas sobre los enteros, la función de masa de probabilidad es una función de densidad con respecto a la medida de conteo . Dado que una función de masa de probabilidad es un tipo particular de función de densidad de probabilidad, a veces encontrará referencias como esta que se refieren a ella como una función de densidad, y no están equivocados al referirse a ella de esta manera.

En el discurso ordinario sobre probabilidad y estadística, a menudo se evita esta terminología y se distingue entre "funciones de masa" (para variables aleatorias discretas) y "funciones de densidad" (para variables aleatorias continuas), para distinguir distribuciones discretas y continuas. En otros contextos, donde se establecen aspectos holísticos de probabilidad, a menudo es mejor ignorar la distinción y referirse a ambos como "funciones de densidad".

Reinstalar a Mónica
fuente
Gracias por tu respuesta. ¿ treatment"En el tratamiento formal de la probabilidad" significa notación, perspectiva, convención u otra cosa?
czlsws
Cuando hablo aquí sobre el "tratamiento formal" me refiero a la base moderna de la teoría de la probabilidad, que es un subconjunto de la teoría de la medida. Esa es la teoría matemática que se acepta como la base formal de la probabilidad.
Vuelva a instalar Mónica
"una función de densidad de probabilidad es una derivada de la medida de probabilidad de interés" Me parece que, en cierto sentido, es más una "anti-integral" que una derivada. Hay archivos PDF discontinuos, como la distribución uniforme, y las distribuciones discretas pueden tratarse como sumas de las funciones delta de Dirac. En esos casos, habría que generalizar el concepto de derivado más allá del entendimiento ordinario para que se aplique.
Acumulación
@Acumulación: ¿cómo es discontinua la distribución uniforme? ... y la teoría de la medida es un tratamiento de integración y diferenciación mucho más general que el que ofrece la comprensión ordinaria de Calc I y II.
jbowman
@Acumulación: Sí, esa es una caracterización justa, y de hecho, eso es lo que se hace. Técnicamente, la densidad es un derivado de Radon-Nikodym , que de hecho es un tipo de "anti-integral" del tipo que usted describe.
Vuelva a instalar Mónica
5

Además de la respuesta más teórica en términos de teoría de la medida, también es conveniente no distinguir entre pmfs y pdf en la programación estadística. Por ejemplo, R tiene una gran cantidad de distribuciones incorporadas. Para cada distribución, tiene 4 funciones. Por ejemplo, para la distribución normal (del archivo de ayuda):

dnorm gives the density, pnorm gives the distribution function, qnorm gives the quantile function, and rnorm generates random deviates.

Los usuarios de R se acostumbran rápidamente a los d,p,q,rprefijos. Sería molesto si tuviera que hacer algo como soltar dy usar, mpor ejemplo, para la distribución binomial. En cambio, todo es como un usuario R esperaría:

dbinom gives the density, pbinom gives the distribution function, qbinom gives the quantile function and rbinom generates random deviates.
John Coleman
fuente
3
scipy.statsdistingue, algunos objetos tienen un pdfmétodo y otros tienen un pmfmétodo. ¡Realmente me molesta!
Matthew Drury