¿Por qué el CDF de una muestra está distribuido uniformemente?

17

He leído aquí que, dada una muestra de una distribución continua con cdf F X , la muestra correspondiente a U i = F X ( X i ) sigue una distribución uniforme estándar.X1,X2,...,XnFXUi=FX(Xi)

He verificado esto usando simulaciones cualitativas en Python, y pude verificar fácilmente la relación.

import matplotlib.pyplot as plt
import scipy.stats

xs = scipy.stats.norm.rvs(5, 2, 10000)

fig, axes = plt.subplots(1, 2, figsize=(9, 3))
axes[0].hist(xs, bins=50)
axes[0].set_title("Samples")
axes[1].hist(
    scipy.stats.norm.cdf(xs, 5, 2),
    bins=50
)
axes[1].set_title("CDF(samples)")

Resultando en la siguiente trama:

Gráfico que muestra la muestra de una distribución normal y el cdf de la muestra.

No puedo entender por qué sucede esto. Supongo que tiene que ver con la definición del CDF y su relación con el PDF, pero me falta algo ...

Le agradecería si alguien pudiera señalarme algo sobre el tema o ayudarme a tener alguna intuición sobre el tema.

EDITAR: El CDF se ve así:

CDF de la distribución muestreada

Maxime Tremblay
fuente
2
Calcule el cdf de . FX(X)
Zhanxiong
2
Encontraría una prueba de esta propiedad (para rv continuos) en cualquier libro sobre simulación, ya que esta es la base del método de simulación de cdf inverso.
Xi'an
2
Prueba también la transformación integral de probabilidad de google-ing
Zachary Blumenfeld
1
@ Xi'an Es bueno señalar que la conclusión es válida solo para variables aleatorias continuas. A veces, este resultado se usa por error para variables aleatorias discretas. Por otro lado, también tenga en cuenta que muchas pruebas implican el paso en el que se asume la estricta monotonicidad de F , que también es una suposición demasiado fuerte. El siguiente enlace proporciona un resumen riguroso sobre este tema: people.math.ethz.ch/~embrecht/ftp/generalized_inverse.pdfP(F(X)x)=P(XF1(x))F
Zhanxiong
@Zhanxiong la única condición necesaria para es que sea càdlàg. F
AdamO

Respuestas:

19

Suponga que es continuo y está aumentando. Defina Z = F X ( X ) y observe que Z toma valores en [ 0 , 1 ] . Entonces F Z ( x ) = P ( F X ( X ) x ) = P ( X F - 1 X ( x ) ) = F X ( F -FXZ=FX(X)Z[0,1]

FZ(x)=P(FX(X)x)=P(XFX1(x))=FX(FX1(x))=x.

U[0,1]

FU(x)=RfU(u)du=0xdu=x.

FZ(x)=FU(x)x[0,1]

Hunaphu
fuente
¿Se deduce que Z tiene una distribución uniforme (0, 1)?
EstadísticasSorceress
@StatsSorceress Sí, tienes razón. Z tiene una distribución estándar uniforme en (0 0,1).
Idonknow
8

Intuitivamente, quizás tenga sentido pensar en F(X) como una función percentil, por ejemplo F(X) de una muestra generada aleatoriamente del DF F se espera que caiga por debajo X. AlternativamenteF-1(creo inversa imágenes, no es una función inversa adecuada per se ) es una función "cuantil". Es decir,X=F-1(pag) es el punto X detrás del cual cae pagproporción de la muestra. La composición funcional es mediblemente conmutativaFF-1=λF-1F.

La distribución uniforme es la única distribución que tiene una función cuantil igual a una función percentil: son la función de identidad. Entonces el espacio de la imagen es el mismo que el espacio de probabilidad.Fasigna variables aleatorias continuas en un espacio (0, 1) con igual medida. Dado que para cualquier dos percentiles,un<si, tenemos PAG(F-1(un)<X<F-1(si))=PAG(un<F(X)<si)=si-un

AdamO
fuente
Luché durante horas, pero finalmente hice clic en por qué la variable aleatoria derivada Y=F(X)Se distribuye uniformemente. Su respuesta realmente ayudó, muchas gracias. Parece mucho en álgebra donde 1 era la identidad multiplicativa.
Aditya P