Sé que el PDF es la primera derivada del CDF para una variable aleatoria continua, y la diferencia para una variable aleatoria discreta. Sin embargo, me gustaría saber por qué esto es así, ¿por qué hay dos casos diferentes para discreto y continuo?
Sé que el PDF es la primera derivada del CDF para una variable aleatoria continua, y la diferencia para una variable aleatoria discreta. Sin embargo, me gustaría saber por qué esto es así, ¿por qué hay dos casos diferentes para discreto y continuo?
Voy a ser un poco impreciso, pero espero intuitivo.
Las distribuciones de probabilidad discretas y continuas deben tratarse de manera diferente. Para cualquier valor en una distribución discreta hay una probabilidad finita. Con una moneda justa, la probabilidad de caras es 0.5, con un dado de seis caras, la probabilidad de un 1 es un sexto, etc. Sin embargo, la probabilidad de cualquier valor específico en una distribución continua es cero, porque un valor específico es solo un valor de un número infinito de valores posibles, y si los valores específicos tuvieran una probabilidad> 0, entonces no sumarían 1. Por lo tanto, con distribuciones continuas hablamos de la probabilidad de rangos de valores.
"Resumir hasta" es clave para responder a su pregunta. Si está familiarizado con el cálculo y su historia, comprende que el signo integral, esa 'S' alargada:—Es un tipo especial de suma: una que describe el caso límite a medida que nos acercamos a la suma de un número infinito de valores extremadamente pequeños entre puntos y en alguna función. Si esa función es un PDF, podemos integrarlo (resumir) para producir un CDF y, a la inversa, diferenciar (diferenciar) el CDF para obtener el PDF.
En el caso discreto, simplemente podemos realizar la suma aritmética estándar (por lo tanto, grande '', en lugar de la alta notación' S ') y la diferenciación aritmética.
"If that function is a CDF, we can integrate it (sum up) to produce a PDF"
Tienes un pedido incorrecto, esto es confuso. Edité para corregir.La diferencia es para la conveniencia y comprensión de las personas que no han tenido que soportar Ph.D. cursos de teoría nivel donde Derivar y demostrar "integral con respecto a la Medida de conteo" . Lo que muestra que realmente no hay diferencia entre distribuciones discretas y continuas, que una suma es realmente una integral (y como @Alexis ya mencionó, una integral es esencialmente una suma) y una diferencia es realmente una derivada (es un poco más simple de ver que una derivada es una diferencia a escala apropiada).
Los libros de texto y los cursos los tratarán de manera diferente porque es más fácil de enseñar / comprender desde el principio en lugar de requerir las matemáticas que muestran que no hay una diferencia.
fuente
(Al menos en los niveles introductorios) el término densidad se refiere solo a variables aleatorias continuas.
Las variables aleatorias discretas tienen una función de masa de probabilidad , a veces llamada función de probabilidad (pmf o pf, no pdf). Esto no devuelve densidad sino probabilidad real.
Algunas variables aleatorias tampoco tienen (pero todavía tienen un cdf).
Piensa en cuál es la definición de un cdf (FX(x)=P(X≤x) ), y luego lo que sucede como x se mueve un poco en ambos casos.
Ahora considere que cualquier salto en el cdf implica que un valor particular tiene una probabilidad distinta de cero (queP(X≤x)>P(X<x) y la diferencia es P(X=x) ) Esa probabilidad distinta de cero para particularx -valores es lo que registra pmf pX(x)=P(X=x) .
(En tratamientos más avanzados, la distinción desaparece).
fuente
En realidad, puede tratar distribuciones continuas y discretas de manera similar, pero para hacerlo debe presentar las funciones delta de Dirac, los límites izquierdos y otros conceptos "avanzados".
Entonces, la manera fácil de responder a su pregunta es que los saltos discretos de CDF son discontinuos. No puedes diferenciarlo en todas partes por eso.
Nuevamente, si conoce la función delta , ¡todo es posible!
fuente