Distribución del máximo de dos variables normales correlacionadas

Respuestas:

22

Según Nadarajah y Kotz, 2008 , Distribución exacta del máximo / mínimo de dos variables aleatorias gaussianas , el PDF de parece serX=max(X1,X2)

f(x)=2ϕ(x)Φ(1r1r2x),

donde es el PDF y es el CDF de la distribución normal estándar.ΦϕΦ

ingrese la descripción de la imagen aquí

Lucas
fuente
¿Cómo se ve esto si (sin correlación en absoluto)? Tengo problemas para visualizarlo. r=0
Mitch
3
Agregué una figura visualizando la distribución. Parece un gaussiano exprimido ligeramente sesgado a la derecha.
Lucas
22

Sea el PDF normal bivariado para con marginales estándar y correlación . El CDF del máximo es, por definición, ( X , Y ) ρfρ(X,Y)ρ

Pr(max(X,Y)z)=Pr(Xz, Yz)=zzfρ(x,y)dydx.

El PDF normal bivariado es simétrico (por reflexión) alrededor de la diagonal. Por lo tanto, aumentar a agrega dos franjas de probabilidad equivalente al cuadrado semi-infinito original: el superior infinitamente grueso es mientras que su contraparte reflejada, el franja derecha, es .z + d z ( - , z ] × ( z , z + d z ] ( z , z + d z ] × ( - , z ]zz+dz(,z]×(z,z+dz](z,z+dz]×(,z]

Figura

La densidad de probabilidad de la franja derecha es la densidad de en veces la probabilidad condicional total de que esté en la franja, . La distribución condicional de siempre es Normal, por lo que para encontrar esta probabilidad condicional total solo necesitamos la media y la varianza. La media condicional de en es la predicción de regresión y la varianza condicional es la varianza "inexplicada" .z Y Pr ( Y zXzYY Y X ρ X var ( Y ) - var ( ρ X ) = 1 - ρ 2Pr(Yz|X=z)YYXρXvar(Y)var(ρX)=1ρ2

Ahora que conocemos la media y la varianza condicionales, se puede obtener el CDF condicional de dado estandarizando y aplicando el estándar Normal CDF :YXYΦ

Pr(Yy|X)=Φ(yρX1ρ2).

La evaluación de esto en y y la multiplicación por la densidad de en (un estándar normal pdf ) da la densidad de probabilidad de la segunda franja (derecha)y=zX=zXzϕ

ϕ(z)Φ(zρz1ρ2)=ϕ(z)Φ(1ρ1ρ2z).

Duplicar esto explica la franja superior equi-probable, dando el PDF del máximo como

ddzPr(max(X,Y)z)=2ϕ(z)Φ(1ρ1ρ2z).

Recapitulación

He coloreado los factores para indicar sus orígenes: para las dos tiras simétricas; para los anchos de tira infinitesimales; y para las longitudes de la tira. El argumento de este último, , es solo una versión estandarizada de condicional en .2ϕ(z)Φ()1ρ1ρ2zY=zX=z

whuber
fuente
¿Se puede extender a más de dos variables normales estándar con una matriz de correlación dada?
A. Donda
1
@ A.Donda Sí, pero la expresión se vuelve más complicada. Con cada nueva dimensión viene la necesidad de integrarse una vez más.
whuber