Explicación intuitiva de la contribución a la suma de dos variables aleatorias distribuidas normalmente

16

Si tengo dos variables aleatorias independientes normalmente distribuidas e con medias y y desviaciones estándar y y descubro que , entonces (suponiendo que no haya cometido ningún error) la distribución condicional de e dado también se distribuyen normalmente con medias y desviación estándar Y μ X μ Y σ X σ Y X + Y = c X Y c μ X | c = μ X + ( c - μ X - μ Y ) σ 2 XXYμXμYσXσYX+Y=CXYC μY| c=μY+(c-μX-μY)σ 2 Y

μXEl |C=μX+(C-μX-μY)σX2σX2+σY2
μYEl |C=μY+(C-μX-μY)σY2σX2+σY2
σXEl |C=σYEl |C=σX2σY2σX2+σY2.

No sorprende que las desviaciones estándar condicionales sean las mismas que, dado C , si una sube, la otra debe bajar en la misma cantidad. Es interesante que la desviación estándar condicional no depende de C .

Lo que no puedo entender son los medios condicionales, donde toman una parte del exceso (C-μX-μY) proporcional a las variaciones originales, no a las desviaciones estándar originales.

Por ejemplo, si tienen medias cero, μX=μY=0 0 , y desviaciones estándar σX=3 y σY=1 luego condicionadas en C=4 4 tendremos mi[XEl |C=4 4]=3.6 y mi[YEl |C=4 4]=0.4 0.4 , es decir, en la relación 9:1 , aunque intuitivamente hubiera pensado que la relación 3:1 sería más natural. ¿Alguien puede dar una explicación intuitiva para esto?

Esto fue provocado por una pregunta de Math.SE

Enrique
fuente

Respuestas:

16

La pregunta se reduce fácilmente al caso mirando e .X - μμX=μY=0 0 Y - μ YX-μXY-μY

Claramente, las distribuciones condicionales son normales. Por lo tanto, la media, la mediana y la moda de cada una coinciden. Los modos ocurrirán en las coordenadas de un máximo local del PDF bivariado de e restringido a la curva . Esto implica el contorno del PDF bivariado en esta ubicación y la curva de restricción tiene tangentes paralelas. (Esta es la teoría de los multiplicadores de Lagrange.) Porque la ecuación de cualquier contorno es de la forma para alguna constante (es decir, todos los contornos son elipses), sus gradientes deben ser paralelos, de ahí que exista tal queXYsol(X,y)=X+y=CF(X,y)=X2/ /(2σX2)+y2/ /(2σY2)=ρρλ

(XσX2,yσY2)=F(X,y)=λsol(X,y)=λ(1,1).

ingrese la descripción de la imagen aquí

Se deduce inmediatamente que los modos de las distribuciones condicionales (y, por lo tanto, también los medios) están determinados por la relación de las variaciones, no de las DE.

Este análisis también funciona para e correlacionados y se aplica a cualquier restricción lineal, no solo a la suma.XY

whuber
fuente
Eso es muy impresionante y bastante más completo de lo que había estado pidiendo. Me hubiera quedado satisfecho con el diagrama y una afirmación de que la tangente a la elipse no pasa por el centro de la elipse, por lo que el punto rojo tangente debe tomar desproporcionadamente más de la variable aleatoria con una desviación estándar más alta.
Henry
1
Eso no estaba bien redactado. Lo que quise decir es que la línea desde el centro hasta el punto rojo no es perpendicular a la tangente.
Henry