He leído aquí que, dada una muestra de una distribución continua con cdf F X , la muestra correspondiente a U i = F X ( X i ) sigue una distribución uniforme estándar.
He verificado esto usando simulaciones cualitativas en Python, y pude verificar fácilmente la relación.
import matplotlib.pyplot as plt
import scipy.stats
xs = scipy.stats.norm.rvs(5, 2, 10000)
fig, axes = plt.subplots(1, 2, figsize=(9, 3))
axes[0].hist(xs, bins=50)
axes[0].set_title("Samples")
axes[1].hist(
scipy.stats.norm.cdf(xs, 5, 2),
bins=50
)
axes[1].set_title("CDF(samples)")
Resultando en la siguiente trama:
No puedo entender por qué sucede esto. Supongo que tiene que ver con la definición del CDF y su relación con el PDF, pero me falta algo ...
Le agradecería si alguien pudiera señalarme algo sobre el tema o ayudarme a tener alguna intuición sobre el tema.
EDITAR: El CDF se ve así:
Respuestas:
Suponga que es continuo y está aumentando. Defina Z = F X ( X ) y observe que Z toma valores en [ 0 , 1 ] . Entonces F Z ( x ) = P ( F X ( X ) ≤ x ) = P ( X ≤ F - 1 X ( x ) ) = F X ( F -FX Z=FX(X) Z [0,1]
fuente
Intuitivamente, quizás tenga sentido pensar enF( x ) como una función percentil, por ejemplo F( x ) de una muestra generada aleatoriamente del DF F se espera que caiga por debajo X . AlternativamenteF- 1 (creo inversa imágenes, no es una función inversa adecuada per se ) es una función "cuantil". Es decir,x = F- 1( p ) es el punto X detrás del cual cae pag proporción de la muestra. La composición funcional es mediblemente conmutativaF∘ F- 1=λF- 1∘ F .
La distribución uniforme es la única distribución que tiene una función cuantil igual a una función percentil: son la función de identidad. Entonces el espacio de la imagen es el mismo que el espacio de probabilidad.F asigna variables aleatorias continuas en un espacio (0, 1) con igual medida. Dado que para cualquier dos percentiles,a < b , tenemos PAG( F- 1( a ) < x < F- 1( b ) ) = P( a < F( X) < b ) = b - a
fuente