¿Cuál es la probabilidad de que

10

Suponga que X e Y son bivariadas normales con media μ=(μ1,μ2) y covarianza Σ=[σ11σ12σ12σ22] . ¿Cuál es la probabilidad Pr(X<Y|min(X,Y)) ?

Miguel
fuente
@whuber bien gracias, borré mis pensamientos ya que no están agregando nada aquí.
AdamO
1
Pr(m<Y|X=m)Pr(m<Y|X=m)+Pr(m<X|Y=m)
Sextus Empiricus el
enlace útil stats.stackexchange.com/questions/30588/… ¿Es esta una pregunta de autoestudio?
Sextus Empiricus
Debe compartir sus pensamientos sobre el problema, independientemente del hecho de que esto parece una pregunta de autoaprendizaje.
StubbornAtom

Respuestas:

7

Usando la notación un poco más explícita , donde es un número real, no una variable aleatoria. El conjunto en el que es una trayectoria en forma de L con dos segmentos medio abiertos: uno que va derecho hacia arriba desde el punto y otro que va derecho a la derecha desde este mismo punto. Está claro que en el tramo vertical, y en el tramo horizontal .m min ( X , Y ) = m ( m , m ) x < y x > yP(X<Y|min(X,Y)=m)mmin(X,Y)=m(m,m)x<yx>y

mu1 = 0, mu2 = 2, sigma11 = 0.5, sigma22 = 1, sigma12 = 0.2, m = 1

Dada esta intuición geométrica, es fácil reescribir el problema en una forma equivalente, donde en el numerador solo tenemos la pata vertical donde y en el denominador tenemos la suma de las dos patas.x<y

(1)P(X<Y|min(X,Y))=P(m<Y|X=m)P(m<Y|X=m)+P(m<X|Y=m)

Entonces ahora necesitamos calcular dos expresiones de la forma . Tales probabilidades condicionales de la distribución normal bivariada siempre tienen una distribución normal con parámetros:N ( μ X | Y = m , s 2 X | Y = m )P(m<X|Y=m)N(μX|Y=m,sX|Y=m2)

(2)μX|Y=m=μ1+σ12σ22(mμ2)

(3)sX|Y=m2=σ11σ122σ22

Tenga en cuenta que en la definición original del problema, refería a elementos de la matriz de covarianza, contrario a la convención más común de usar para la desviación estándar. A continuación, encontraremos más conveniente usar para la varianza para la desviación estándar de la distribución de probabilidad condicional. σ s 2 sσijσs2s

Conociendo estos dos parámetros, podemos calcular la probabilidad de que partir de la función de distribución acumulativa.m<X

(4)P(m<X|Y=m)=Φ(μX;Y=mmsX;Y=m)

mutatis mutandis , tenemos una expresión similar para . DejarP(Y>m|X=m)

(5)zX|Y=m=μX;Y=mmsX;Y=m

y

(6)zY|X=m=μY;X=mmsY;X=m

Entonces podemos escribir la solución completa de manera compacta en términos de estas dos puntuaciones :z

(7)P(X<Y|min(X,Y)=m)=1Φ(zX|Y=m)Φ(zX|Y=m)+Φ(zY|X=m)

Según el código de simulación proporcionado por el autor de la pregunta, podemos comparar este resultado teórico con los resultados simulados:

ingrese la descripción de la imagen aquí

olooney
fuente
En (3) creo que el lado izquierdo debería tener un cuadrado, porque es la varianza condicional, mientras que la desviación estándar se usa más adelante.
Yves
Tienes mucha razón @Yves, y creo que mis ediciones recientes han solucionado el problema. Gracias.
olooney
@olooney, gracias por esta respuesta. Puedo seguir la derivación y parece correcta. Sin embargo, intenté verificar (1) y (7) en una simulación y los resultados fueron bastante diferentes. Puedes ver mi código R aquí gist.github.com/mikeguggis/d041df05565f63f8be2c6c51f5cf8961
mike
@ Mike, creo que tuve un error de señal. Después de arreglar eso, el resultado teórico parece estar de acuerdo con los resultados de la simulación. gist.github.com/olooney/e88a66d2d2fa7f2f0cd0d0dd6b708739
olooney
@olooney, buena captura. Todavía no puedo entender por qué las dos estimaciones basadas en simulación no coinciden (líneas 30-32 en mi código).
mike
1

La pregunta puede reescribirse usando una versión modificada del teorema de Bayes (y un abuso de la noción para )Pr

Pr(X<Y|min(X,Y)=m)=Pr(min(X,Y)=m|X<Y)Pr(X<Y)Pr(min(X,Y)=m|X<Y)Pr(X<Y)+Pr(min(X,Y)=m|XY)Pr(XY)=Pr(X<Y,min(X,Y)=m)Pr(X<Y,min(X,Y)=m)+Pr(XY,min(X,Y)=m).

Defina como el PDF bivariado de e , y . EntoncesfX,YXYϕ(x)=12πexp(12x2)Φ(x)=xϕ(t)dt

Pr(X<Y,min(X,Y)=m)=Pr(X=m,Y>m)=mfX,Y(m,t)dt

y

Pr(XY,min(X,Y)=m)=Pr(Xm,Y=m)=mfX,Y(t,m)dt

Usando la normalidad y la definición de probabilidad condicional, los integrandos pueden reescribirse como

fX,Y(m,t)=fY|X(t)fX(m)=1σY|Xϕ(tμY|XσY|X)1σ11ϕ(mμ1σ11)

y

fX,Y(t,m)=fX|Y(t)fY(m)=1σX|Yϕ(tμX|YσX|Y)1σ22ϕ(mμ2σ22).

Donde

μX|Y=μ1+σ12σ22(mμ2),

μY|X=μ2+σ12σ11(mμ1),

σX|Y=(1σ122σ11σ22)σ11

y

σY|X=(1σ122σ11σ22)σ22.

Así

Pr(X<Y|min(X,Y)=m)=(1Φ(mμY|XσY|X))1σ11ϕ(mμ1σ11)(1Φ(mμY|XσY|X))1σ11ϕ(mμ1σ11)+(1Φ(mμX|YσX|Y))1σ22ϕ(mμ2σ22).

Esta forma final es muy similar al resultado al que llegó @olooney. La diferencia es que sus probabilidades no están ponderadas por las densidades normales.

Puede encontrar un script R para verificación numérica aquí

Miguel
fuente