CDF empírico vs CDF

21

Estoy aprendiendo sobre la función empírica de distribución acumulativa. Pero aun no entiendo

  1. ¿Por qué se llama 'Empírico'?

  2. ¿Hay alguna diferencia entre Empirical CDF y CDF?

Gammaries
fuente
Hay una explicación simple, directa y elegante en términos de boletos en una caja de modelos : el CDF describe lo que está en la caja original. El ECDF es lo que obtienes cuando pones tu muestra (que es un conjunto de tickets extraídos de la caja original: los llamados datos "empíricos") en una caja vacía.
whuber
Una cosa a tener en cuenta es que su distribución empírica generalmente está limitada por la forma en que está construida, mientras que el CDF puede no estarlo. Por ejemplo, si construye CDF empírico a partir de observaciones de la variable de Poisson, el ECDF obtenido estará limitado por la frecuencia más alta observada, mientras que el CDF verdadero no tiene límites.
Aksakal

Respuestas:

27

Deje ser una variable aleatoria.X

  • La función de distribución acumulativa proporciona .F(X)PAG(XX)
  • Una función empírica de función de distribución acumulativa proporciona función de las observaciones de su muestra.sol(X)PAG(XX)

La distinción es qué medida de probabilidad se utiliza. Para el CDF empírico, utiliza la medida de probabilidad definida por los conteos de frecuencia en una muestra empírica.

Ejemplo simple (lanzamiento de moneda):

Supongamos que es una variable aleatoria que denota el resultado de un solo lanzamiento de moneda donde denota caras y denota colas.XX=1X=0 0

El CDF para una moneda justa viene dado por:

F(X)={0 0para X<0 012para 0 0X<11para 1X

Si volteó 2 cabezas y 1 cola, el CDF empírico sería:

sol(X)={0 0para X<0 023para 0 0X<11para 1X

La CDF empírica podría reflejar que en su muestra, 2/ /3 de sus lanzamientos eran cabezas.

F

X0 01

El CDF está dado por:

F(X)=-X12πmi-X22

Digamos que tuvo 3 sorteos IID y obtuvo los valores . El CDF empírico sería: X1<X2<X3

sol(y)={0 0para y<X113para X1y<X223para X2y<X31para X3y

Con suficientes sorteos de IID (y se cumplen ciertas condiciones de regularidad), el CDF empírico convergería en el CDF subyacente de la población.

Matthew Gunn
fuente
12

¿Hay alguna diferencia entre Empirical CDF y CDF?

Si, son diferentes. Un cdf empírico es un cdf apropiado, pero los cdf empíricos siempre serán discretos, incluso cuando no se extraigan de una distribución discreta, mientras que el cdf de una distribución puede ser otras cosas además de discreto.

Si trata una muestra como si fuera una población de valores, cada uno igualmente probable (es decir, coloque la probabilidad 1 / n en cada observación), entonces el cdf de esa distribución sería el ECDF de los datos.

¿Por qué se llama 'Empírico'?

Es una estimación de la población cdf basada en la muestra; específicamente, si trata las proporciones de la muestra en cada valor de datos distinto y lo trata como si fuera una probabilidad en la población, obtiene el ECDF.

Empírico tiene un significado algo así como "por observación en lugar de teoría", y eso es exactamente lo que significa en este caso ... usar las observaciones para determinar la función de distribución.

Glen_b -Reinstate a Monica
fuente
10

El CDF empírico se construye a partir de un conjunto de datos real (en el gráfico a continuación, utilicé 100 muestras de una distribución normal estándar). El CDF es una construcción teórica: es lo que vería si pudiera tomar infinitas muestras.

El CDF empírico generalmente se aproxima bastante bien al CDF, especialmente para muestras grandes (de hecho, existen teoremas sobre la rapidez con que converge al CDF a medida que aumenta el tamaño de la muestra).

CDF empírico vs CDF

Chris Taylor
fuente
10

Empírico es algo que construyes a partir de datos y observaciones. Por ejemplo, suponga que desea saber acerca de la distribución de la altura de las personas en un país. Se comienza midiendo personas y se obtiene un histograma que se puede aproximar a una distribución. Luego calcula el CDF empírico.

Si está utilizando una distribución estadística (una fórmula determinista que proporciona exactamente la misma salida con los mismos parámetros), también puede calcular su CDF.

norte(μ=1,75 metro,σ=0.1 metro)

berkorbay
fuente
¿Existe una medida de confianza empleada que exprese la probabilidad de que CDF y Emperical CDF describan la misma población en el límite de todos los muestreos experimentales en el mundo? Esto parece tener aplicación en las encuestas electorales, por ejemplo. (aunque tal vez no, ya que la salida no se puede describir estrictamente como una función ...)
BenPen
3

Según Dictionary.com , las definiciones de "empírico" incluyen:

derivado o guiado por la experiencia o el experimento.

Por lo tanto, el CDF empírico es el CDF que obtiene de sus datos. Esto contrasta con el CDF teórico (a menudo llamado "CDF"), que se obtiene de un modelo estadístico o probabilístico como la distribución Normal.

Waldir Leoncio
fuente