Alguien me hizo esta pregunta en una entrevista de trabajo y le respondí que su distribución conjunta siempre es gaussiana. Pensé que siempre podría escribir un gaussiano bivariado con sus medios, varianza y covarianzas. Me pregunto si puede haber un caso en el que la probabilidad conjunta de dos gaussianos no sea gaussiana.
91
Respuestas:
¡La distribución normal bivariada es la excepción , no la regla!
Es importante reconocer que "casi todas" las distribuciones conjuntas con márgenes normales no son la distribución normal bivariada. Es decir, el punto de vista común de que las distribuciones conjuntas con marginales normales que no son bivariadas son de alguna manera "patológicas", es un poco equivocado.
Ciertamente, la normalidad multivariada es extremadamente importante debido a su estabilidad bajo transformaciones lineales, y por eso recibe la mayor parte de la atención en las aplicaciones.
Ejemplos
Es útil comenzar con algunos ejemplos. La siguiente figura contiene mapas de calor de seis distribuciones bivariadas, todas las cuales tienen márgenes normales normales. Los de la izquierda y el medio en la fila superior son normales bivariados, los restantes no lo son (como debería ser evidente). Se describen más abajo.
Los huesos desnudos de las cópulas.
Las propiedades de dependencia a menudo se analizan eficientemente usando cópulas . Una cópula bivariada es solo un nombre elegante para una distribución de probabilidad en la unidad cuadrada con marginales uniformes .[0,1]2
Supongamos que es una cópula bivariada. Entonces, inmediatamente de lo anterior, sabemos que , y , por ejemplo.C ( u , v ) ≥ 0 C ( u , 1 ) = u C ( 1 , v ) = vC(u,v) C(u,v)≥0 C(u,1)=u C(1,v)=v
Podemos construir variables aleatorias bivariadas en el plano euclidiano con marginales preespecificados mediante una simple transformación de una cópula bivariada. Deje que y se prescriban distribuciones marginales para un par de variables aleatorias . Entonces, si es una cópula bivariada, es una función de distribución bivariada con marginales y . Para ver este último hecho, solo tenga en cuenta que El mismo argumento funciona para .F 2 ( X , Y ) C ( u , v ) F ( x , y ) = C ( F 1 ( x ) , F 2 ( y ) ) F 1 F 2 P ( X ≤ x ) = P ( X ≤ x , Y < ∞ ) = C ( FF1 F2 (X,Y) C(u,v)
Para y continuos , el teorema de Sklar afirma una inversa que implica unicidad. Es decir, dada una distribución bivariada con marginales continuos , , la cópula correspondiente es única (en el espacio de rango apropiado).F 2 F ( x , y ) F 1 F 2F1 F2 F(x,y) F1 F2
La bivariada normal es excepcional.
El teorema de Sklar nos dice (esencialmente) que solo hay una cópula que produce la distribución normal bivariada. Esta es, acertadamente llamada, la cópula gaussiana que tiene densidad en donde el numerador es la distribución normal bivariada con correlación evaluada en y .[0,1]2
Pero, hay muchas otras cópulas y todas ellas darán una distribución bivariada con marginales normales que no es la bivariada normal al usar la transformación descrita en la sección anterior.
Algunos detalles sobre los ejemplos
Tenga en cuenta que si es una cópula arbitraria con densidad , la densidad bivariada correspondiente con marginales normales estándar bajo la transformación esC(u,v) c(u,v) F(x,y)=C(Φ(x),Φ(y))
Tenga en cuenta que al aplicar la cópula gaussiana en la ecuación anterior, recuperamos la densidad normal bivariada. Pero, para cualquier otra opción de , no lo haremos.c(u,v)
Los ejemplos en la figura se construyeron de la siguiente manera (cruzando cada fila, una columna a la vez):
fuente
library(copula)
kcf <- khoudrajiCopula(copula2 = claytonCopula(6), shapes = fixParam(c(.4, 1), c(FALSE, TRUE)))
# force normal margins
evil <- mvdc(kcf, c("norm", "norm"), list(list(mean = 0, sd =1), list(mean = 0, sd = 1)))
contour(evil, dMvdc, xlim = c(-3, 3), ylim=c(-3, 3))
Es cierto que cada elemento de un vector normal multivariante está distribuido en sí mismo normalmente, y puede deducir sus medias y variaciones. Sin embargo, no es cierto que cualquiera de las dos variables aleatorias guasianas se distribuyan normalmente de manera conjunta. Aquí hay un ejemplo:
Editar: En respuesta al consenso de que una variable aleatoria que es una masa puntual puede considerarse como una variable normalmente distribuida con , estoy cambiando mi ejemplo.σ2=0
Deje y deje donde es una variable aleatoria . Es decir, cada uno con probabilidad .X∼N(0,1) Y=X⋅(2B−1) B Bernoulli(1/2) Y=±X 1/2
Primero mostramos que tiene una distribución normal estándar.Y Por la ley de probabilidad total ,
Próximo,
donde es el CDF normal estándar . Similar,Φ
Por lo tanto,
entonces, el CDF de es , entonces .Y Φ(⋅) Y∼N(0,1)
Ahora mostramos que no se distribuyen normalmente de manera conjunta.X,Y Como señala @cardinal, una caracterización de la multivariada normal es que cada combinación lineal de sus elementos está normalmente distribuida. no tienen esta propiedad, ya queX,Y
Por lo tanto, es una mezcla de una variable aleatoria y una masa puntual en 0, por lo tanto, no puede distribuirse normalmente.Y+X 50/50 N(0,4)
fuente
La siguiente publicación contiene un resumen de una prueba, solo para dar las ideas principales y comenzar.
Sea dos variables aleatorias gaussianas independientes y sea serz=(Z1,Z2) x=(X1,X2)
Cada , pero como ambas son combinaciones lineales de los mismos r.vs independientes, son dependientes conjuntamente.Xi∼N(μi,σ2i)
Definición Se dice que un par de r.vs es bivariante normalmente distribuido si se puede escribir como una combinación lineal de r.vs normal independiente .x=(X1,X2) x=Az z=(Z1,Z2)
Lema Si es una Gaussiana bivariada, cualquier otra combinación lineal de ellas es nuevamente una variable aleatoria normal.x=(X1,X2)
Prueba . Trivial, saltado para no ofender a nadie.
Propiedad Si no están correlacionadas, entonces son independientes y viceversa.X1,X2
Distribución deX1|X2
Suponga que son los mismos r.vs gaussianos que antes pero supongamos que tienen una varianza positiva y una media cero para simplificar.X1,X2
Si es el subespacio que abarca , deje que y .S X2 XS1=ρσX1σX2X2 XS⊥1=X1−XS1
La descomposición mantiene con
Entonces
Dos variables aleatorias gaussianas univariadas son conjuntamente gaussianas si las condicionales e son gaussianos.X | Y Y | XX,Y X|Y Y|X
fuente