Límites en la expectativa condicional con márgenes normales y correlación especificada (Pearson)

8

Vi la siguiente pregunta en otro foro:

"Suponga que tanto la altura como el peso de los hombres adultos se pueden describir con modelos normales, y que la correlación entre estas variables es de 0.65. Si la altura de un hombre lo ubica en el percentil 60, ¿en qué percentil esperaría que estuviera su peso?"

Veo que alguien en el foro en cuestión ya ha señalado que la pregunta habla de que los márgenes son normales ( height and weight ... can be described with normal models), no de la normalidad bivariada, por lo que la pregunta no tiene una sola respuesta.

Claramente, la respuesta dependería de la relación de dependencia bivariada real (la cópula), lo que me dejó curioso.

Mi pregunta es:

Dados los márgenes normales y una correlación de población específica ( , una correlación de Pearson), ¿existe una manera razonablemente sencilla de encontrar límites enρE(Y|X=xq) dado X,Y ambos normales, con correlación ρ?

Si hay un valor máximo exacto y un valor mínimo para la expectativa condicional, sería bueno saber eso (y, de preferencia, las circunstancias en las que cada uno ocurre *).

* Tengo algunas fuertes sospechas sobre cuáles podrían ser esas circunstancias (es decir, el tipo de dependencia que podría estar involucrado; en particular, espero que un tipo específico de distribución degenerada dé los límites) pero aún no he investigado ese pensamiento en ningún profundidad. (Me imagino que es probable que alguien ya lo sepa).

De lo contrario, los límites superiores o inferiores en los valores más grandes y más pequeños serían interesantes.

No necesito necesariamente una respuesta algebraica (algún algoritmo sí lo haría), aunque una respuesta algebraica sería buena.

Las respuestas aproximadas o parciales pueden ser útiles / útiles.

Si nadie tiene buenas respuestas, puedo intentarlo yo mismo.

Glen_b -Reinstate a Monica
fuente

Respuestas:

4

Creo que no hay límites. Esta conclusión se basa en la siguiente construcción, que es más simple de describir para distribuciones continuas arbitrarias. A medida que avanzamos, se agregarán condiciones hasta que estemos en el caso de los marginales normales.

Entonces deja X ser cualquier variable aleatoria continua con función de distribución F. Dado cualquier intervalo medio abierto(a,b] (que eventualmente se volverá muy estrecho), defina

ψ:(a,b](,c]

vía

ψ(x)=F1(F(x)F(a)).

Esto está aumentando monotónicamente y evidentemente c=ψ(b)=F1(F(b)F(a)). Por construcción,

Pr(X(a,b])=Pr(ψ(X)c).

Extienda a un mapa uno a uno través deψΨ:RR

Ψ|(a,b]=ψ,Ψ|(,c]=ψ1

y de lo contrario . La distribución de es idéntica a la de , pero lo que ha hecho es intercambiar los valores entre los dos intervalos y .Ψ(x)=xΨ(X)X(a,b](,c]

Figura 1: gráfico de Psi

Ejemplo de para .Ψ(a,b]=(1.5,1.75]

Deje que la correlación de Pearson de sea . (Sin pérdida de generalidad, ahora podemos suponer que tanto como(X,Y)ρ(1,1)XY han sido estandarizados porque esto no cambiará ρ ni la continuidad de X) Dejarxq ser cualquier número real, como en la pregunta, donde la expectativa condicional de Ydebe ser evaluado Escoger(a,b] para cual xq(a,b] pero hazlo tan estrecho que Pr(X(a,b])es pequeño Entonces el cambio deρ=E(XY) a ρ=E(Ψ(X)Y)puede hacerse arbitrariamente pequeño. (Se necesita un poco de trabajo para mostrar esto; todo se reduce al hecho de que la expectativa condicional deY dado Xc aumenta relativamente lento a medida que |ba|disminuye Si no fuera asíρ no se definiría). Sin embargo, la aplicación Ψ cambios E(Y|X=xq) a

E(Y|Ψ(X)=xq)=E(Y|X=Ψ(xq)),

que es una expectativa condicional para Y a algún valor de X Menos que o igual a c.

Figura 2: gráfico del PDF de (Psi (X), Y)

Contornos del PDF. aquí(a,b]=(1.5,1.75]. La distribución normal bivariada original recibió una correlación de0.85, que se redujo a aproximadamente 0.5--el valor objetivo - cuando se intercambiaron las probabilidades en las dos tiras.

Cuando (X,Y) es una distribución normal bivariada, c como |ba|0. Previstoρ0, la expectativa condicional de Y es empujado a para ρ>0 y para + para ρ<0. Una construcción análoga, intercambiando el intervalo(a,b] con [c,), empujará la expectativa condicional de Yinfinitamente lejos en la otra dirección. Al ajustar el valor original deρ levemente podemos compensar el cambio infinitesimal en ρeso ocurre, mostrando que no importa cuál sea el valor original deρ puede ser, no podemos decir nada sobre la expectativa condicional de Y en cualquier punto particular X=xq.

(La aparente excepción ρ=0 puede manejarse comenzando con, por ejemplo, una distribución bivariada con marginales normales cuyo soporte se limita a las líneas y=±x.)

whuber
fuente
+1 Esto es muy interesante. Está algo relacionado con la construcción que tenía en mente al escribir la pregunta, pero está mejor orientado a mover solo el condicional en la vecindad inmediata del cuantil y una discusión más reflexiva de la que había jugado. Su conclusión parece ser correcta en primera lectura. Gracias.
Glen_b -Reinstala a Monica
En realidad, +1 es inadecuado aquí.
Glen_b -Reinstale a Monica
0

Si entiendo su pregunta correctamente, la respuesta depende de la "relación de dependencia bivariada real (la cópula)" utilizada.

Bueno, existen límites en el valor que puede tomar una cópula, ¿verdad? Entonces, ¿por qué no usar la cópula de comonotonicidad y la cópula de contramonotonicidad para establecer los límites?

ingrese la descripción de la imagen aquí

Fuente: Thorsten Schmidt - Lidiando con las cópulas

Henry E
fuente
La pregunta es más restrictiva que los límites de las cópulas: no puede alcanzar los límites de co y contramonotonicidad debido a la restricción en ρ.
Glen_b -Reinstala a Monica