¿Los CDF son más fundamentales que los PDF?

43

Mi profesor de estadísticas básicamente dijo que si se le da uno de los siguientes tres, puede encontrar los otros dos:

  • Función de distribución acumulativa
  • Función generadora de momentos
  • Función de densidad de probabilidad

Pero mi profesor de econometría dijo que los CDF son más fundamentales que los PDF porque hay ejemplos en los que puede tener un CDF pero el PDF no está definido.

¿Los CDF son más fundamentales que los PDF? ¿Cómo sé si un PDF o un MGF pueden derivarse de un CDF?

Stan Shunpike
fuente
23
¿Es este algún tipo de concurso de fundamentalidad? ¿Tenemos un panel de jueces famosos? Todos estos tres conceptos se pueden usar para definir una medida en un espacio . Sin embargo, para un CDF dado, MGF y PDF pueden no existir, ya que PDF se define como un derivado de CDF, y MGF se define como , y esto No es necesario que exista integral. Sin embargo, esto no significa que ninguno de estos conceptos sea menos fundamental. Fundamental es un buen adjetivo que no tiene definición matemática. Es sinónimo de importante. R exp(tx)dF(x)RreRexp(tx)dF(x)
mpiktas
66
@mpiktas: Cada distribución de probabilidad en (un subconjunto de) tiene un CDF, y define de manera única la distribución. Sin embargo, no todas las distribuciones de probabilidad tienen un PDF o un MGF (pero todas tienen una función característica ). Rnorte
Ilmari Karonen
3
@mpiktas Usted podría hacerlo con en . Entonces no está definido. Sin embargo, es claro para mí por qué el profesor usó la expresión "más fundamental". El adjetivo podría no tener un significado matemático bien definido, pero ¿y qué? algunos) en inglés también. Cada PDF que conocemos tiene un CDF subyacente. Aquí "subyacente" tiene una buena asociación con "fundamental". Lo contrario no es cierto.R P ( ( - , x ] )A={R,}RP((,x])
drhab
2
@drhab, naturalmente, estaba hablando del derivado Radon-Nikodym :) También entiendo perfectamente lo que el profesor tenía en mente, pero en mi opinión es peligroso usar tales expresiones con los estudiantes, porque en lugar de tratar de entender la diferencia entre Los conceptos matemáticos intentan clasificarlos según la fundamentalidad, lo cual es fundamentalmente incorrecto. Juego de palabras previsto.
mpiktas
44
@mpiktas: claro, no hay una definición precisa de "fundamental". Pero hay un gran punto medio entre "rigurosamente definido" y "totalmente sin sentido". En nuestras propias matemáticas, por supuesto, todo debe ser al final completamente riguroso, por lo que nos acostumbramos a abofetear todo lo que no lo es. Pero cuando hablamos y pensamos en matemáticas, tenemos nociones subjetivas pero significativas como "fundamental", "general", etc., al igual que todos los demás; Y eso está bien.
PLL

Respuestas:

69

Cada distribución de probabilidad en (un subconjunto de) tiene una función de distribución acumulativa , y define de forma única la distribución. Entonces, en este sentido, el CDF es tan fundamental como la distribución misma.Rnorte

Una función de densidad de probabilidad , sin embargo, sólo existe para (absolutamente) distribuciones de probabilidad continuas . El ejemplo más simple de una distribución que carece de un PDF es cualquier distribución de probabilidad discreta , como la distribución de una variable aleatoria que solo toma valores enteros.

Por supuesto, tales distribuciones de probabilidad discretas se pueden caracterizar por una función de masa de probabilidad en su lugar, pero también hay distribuciones que no tienen ni PDF ni PMF, como cualquier mezcla de una distribución continua y una discreta:

Diagrama de distribuciones de probabilidad continua, discreta y mixta.
(Diagrama robado descaradamente de la respuesta de Glen_b a una pregunta relacionada).

Incluso hay distribuciones de probabilidad singulares , como la distribución de Cantor , que no se pueden describir incluso mediante una combinación de un PDF y un PMF. Sin embargo, tales distribuciones todavía tienen un CDF bien definido. Por ejemplo, aquí está el CDF de la distribución de Cantor, también llamada a veces la "escalera del diablo":

Distribución Cantor CDF
( Imagen de Wikimedia Commons de los usuarios Theon y Amirki , utilizada bajo la licencia CC-By-SA 3.0 ).

El CDF, conocido como la función de Cantor , es continuo pero no absolutamente continuo. De hecho, es constante en todas partes, excepto en un conjunto de Cantor de medida de Lebesgue cero, pero que todavía contiene infinitos puntos. Por lo tanto, toda la masa de probabilidad de la distribución de Cantor se concentra en este subconjunto cada vez más pequeño de la recta numérica real, pero cada punto del conjunto aún tiene una probabilidad cero individualmente.


También hay distribuciones de probabilidad que no tienen una función generadora de momento . Probablemente el ejemplo más conocido es la distribución Cauchy , una distribución de cola gruesa que no tiene momentos bien definidos de orden 1 o superior (por lo tanto, en particular, ¡no tiene una media o varianza bien definida!).

Rnorte

Ilmari Karonen
fuente
Usted dice que todas las distribuciones tienen CDF, pero no todas tienen PDF, pero en realidad hay distribuciones que tienen PDF y no tienen CDF de forma cerrada, por ejemplo, multivariante normal.
Tim
13
@Tim: Eso es cierto, pero solo con el calificador de "forma cerrada"; el CDF todavía existe, incluso si no podemos escribirlo en forma cerrada. Y, en cualquier caso, la definición de una " expresión de forma cerrada " es notoriamente difusa; según algunas definiciones estrictas, incluso la distribución normal univariante no tiene un CDF de forma cerrada, pero si considera que la función de error es de forma cerrada, sí la tiene.
Ilmari Karonen
11
@Tim No es un contraejemplo. Es una propiedad arbitraria que usted eligió como importante / fundamental para usted. Para mí, la propiedad "existe" es más importante que "tiene forma cerrada". Más aún, "siempre existe" versus "a veces puede no tener forma cerrada, como cualquier función".
Ark-kun
3
[0 0,1]R
1
@ Ark-kun Estoy jugando a los defensores de los demonios aquí, ya que hay casos en los que PDF es algo más "directamente disponible" que CDF. Me gusta esta respuesta (+1), pero en mi humilde opinión, esto es algo que también podría mencionarse.
Tim
16

Creo que su profesor de econometría estaba pensando algo en las siguientes líneas.

F[0 0,1]

F(X)=12X para X<12
F(X)=12X+12 para X12

[0 0,1]

PAGS({12})=12

F

F

Por la definición de un PDF, debemos tener

0 0XF(t)ret=F(X)-F(0 0)=14 4X

0 0<X<12

F(X)=14 4 para X<12

X>12

F(X)=14 4 para X>12

FF(12)F(12)

PAGS({12})=12

necesitaríamos

12-ϵ12+ϵF(t)ret>12

12

12-ϵ12+ϵF(t)ret=12-ϵ12+ϵ14 4ret=12ϵ

F

Puede recuperar el espíritu de un PDF, pero debe usar objetos matemáticos más sofisticados, ya sea una medida o una distribución .

Matthew Drury
fuente
3
12δ(X-12)δ(X)X=0 0
-+δ(X)reX=1
2
L1
@IwillnotexistIdonotexist Lo que dijo Whuber es lo que estaba insinuando en la última línea. Usé la palabra "distribución".
Matthew Drury
44
1/ /21/ /2
4

Ilmari da una buena respuesta desde una perspectiva teórica. Sin embargo, también se puede preguntar para qué sirven la densidad (pdf) y la función de distribución (pdf) para los cálculos prácticos. Esto podría aclarar para qué situaciones una es más directamente útil que la otra.

R(-,X]--

Sin embargo, la densidad es esencial para las estadísticas, ya que la probabilidad se define en términos de densidad. Por lo tanto, si queremos calcular la estimación de máxima verosimilitud, necesitamos directamente la densidad.

Si pasamos a la comparación de una distribución empírica y una teórica, ambas pueden ser útiles, pero a menudo se prefieren métodos como los gráficos pp- y qq basados ​​en la función de distribución.

Rrere2

NRH
fuente