Ejemplo de dos variables normales * correlacionadas * cuya suma no es normal

10

Soy consciente de algunos buenos ejemplos de pares de variables aleatorias correlacionadas que son marginalmente normales pero no conjuntamente normales. Vea esta respuesta de Dilip Sarwate , y esta del cardenal .

También conozco un ejemplo de dos variables aleatorias normales cuya suma no es normal. Ver esta respuesta de Macro . Pero en este ejemplo, las dos variables aleatorias no están correlacionadas.

¿Hay un ejemplo de dos variables aleatorias normales que tienen una covarianza distinta de cero y cuya suma no es normal? ¿O es posible demostrar que la suma de dos variables aleatorias normales correlacionadas, incluso si no son bivariadas normales, debe ser normal?

[Contexto: tengo una pregunta de tarea que pide la distribución de donde X e Y son normales estándar con correlación ρ . Creo que la pregunta pretendía especificar que son bivariados normales. Pero me pregunto si se puede decir algo sin este supuesto adicional para ρ distinto de cero.]aX+bYXYρρ

¡Gracias!

mww
fuente
55
La respuesta de Cardinal, que usted cita, ya contiene una solución: vea la esquina superior derecha en su panel de ejemplos.
whuber
Por favor, ¿puedes explicar cómo? Especifica una distribución conjunta , que produce dos marginales normales. No me queda claro que la suma de los dos marginales normales no sea normal, que es lo que busco. (Véase también mi comentario sobre la respuesta de Glen_b a continuación.)
mww
3
Solo a partir de la imagen, es obvio que la densidad de la suma en cero es cero (porque la línea intersecta la trama en un solo punto, que tiene la medida cero), mientras que la suma en sí es tan obviamente simétrica respecto a cero, que muestra que cero es el centro de la distribución de la suma. Tal distribución no puede ser Normal porque las distribuciones normales tienen densidades distintas de cero en sus centros. x+y=0
whuber

Respuestas:

11

Casi cualquier cópula bivariada producirá un par de variantes aleatorias normales con alguna correlación distinta de cero (algunas darán cero pero son casos especiales). La mayoría (casi todos) de ellos producirán una suma no normal.

En algunas familias de cópulas se puede producir cualquier correlación de Spearman deseada (población) ; la dificultad es solo encontrar la correlación de Pearson para los márgenes normales; es factible en principio, pero el álgebra puede ser bastante complicado en general. [Sin embargo, si tiene la correlación de Spearman de la población, la correlación de Pearson, al menos para márgenes de cola ligera como el gaussiano, puede no estar demasiado lejos en muchos casos].

Todos menos los dos primeros ejemplos en la trama del cardenal deberían dar sumas no normales.


Algunos ejemplos: los dos primeros son de la misma familia de cópulas que el quinto de las distribuciones bivariadas del ejemplo del cardenal, el tercero es degenerado.

Ejemplo 1:

Cópula Clayton ( )θ=0.7

histogramas de márgenes normales, suma no normal y gráfico de distribución bivariada

Aquí la suma es claramente distinta y bastante sesgada a la derecha

 

Ejemplo 2

Cópula Clayton ( )θ=2

histogramas de márgenes normales, suma no normal y gráfico de distribución bivariada

Aquí la suma queda ligeramente sesgada. En caso de que no sea bastante obvio para todos, aquí volteé la distribución (es decir, tenemos un histograma de en púrpura pálido) y lo superpuse para que podamos ver la asimetría más claramente:(x+y)

histograma superpuesto de x + y y - (x + y)

 

X=XY=Y

Por otro lado, si solo negamos uno de ellos, cambiaríamos la asociación entre la fuerza de la asimetría con el signo de la correlación (pero no la dirección de la misma).

También vale la pena jugar con algunas cópulas diferentes para tener una idea de lo que puede suceder con la distribución bivariada y los márgenes normales.

Los márgenes gaussianos con una t-cópula se pueden experimentar sin preocuparse mucho por los detalles de las cópulas (generar a partir de una bivariada correlacionada t, que es fácil, luego transformar en márgenes uniformes a través de la transformación integral de probabilidad, luego transformar los márgenes uniformes en gaussiano a través de cdf normal inverso). Tendrá una suma no normal pero simétrica. Entonces, incluso si no tiene buenos paquetes de cópula, aún puede hacer algunas cosas con bastante facilidad (por ejemplo, si intentara mostrar un ejemplo rápidamente en Excel, probablemente comenzaría con la t-cópula).

-

Ejemplo 3 : (esto es más parecido a lo que debería haber comenzado inicialmente)

UV=U0U<12V=32U12U1UVX=Φ1(U),Y=Φ1(V)X+Y

ingrese la descripción de la imagen aquí

En este caso, la correlación entre ellos es de alrededor de 0,66.

XY

U(12c,12+c)c[0,12]V


Algún código:

library("copula")
par(mfrow=c(2,2))

# Example 1
U <- rCopula(100000, claytonCopula(-.7))
x <- qnorm(U[,1])
y <- qnorm(U[,2])
cor(x,y)
hist(x,n=100)
hist(y,n=100)
xysum <- rowSums(qnorm(U))
hist(xysum,n=100,main="Histogram of x+y")
plot(x,y,cex=.6,
       col=rgb(0,100,0,70,maxColorValue=255),
       main="Bivariate distribution")
text(-3,-1.2,"cor = -0.68")
text(-2.5,-2.8,expression(paste("Clayton: ",theta," = -0.7")))

El segundo ejemplo:

#--
# Example 2:
U <- rCopula(100000, claytonCopula(2))
x <- qnorm(U[,1])
y <- qnorm(U[,2])
cor(x,y)
hist(x,n=100)
hist(y,n=100)
xysum <- rowSums(qnorm(U))
hist(xysum,n=100,main="Histogram of x+y")
plot(x,y,cex=.6,
    col=rgb(0,100,0,70,maxColorValue=255),
    main="Bivariate distribution")
text(3,-2.5,"cor = 0.68")
text(2.5,-3.6,expression(paste("Clayton: ",theta," = 2")))
#
par(mfrow=c(1,1))

Código para el tercer ejemplo:

#--
# Example 3:
u <- runif(10000)
v <- ifelse(u<.5,u,1.5-u)
x <- qnorm(u)
y <- qnorm(v)
hist(x+y,n=100)
Glen_b -Reinstate a Monica
fuente
X+Y=2IZ+(1I)U+(1I)VI=0U+VI=12ZLa distribución no es normal.
mww
ρ
He reemplazado el ejemplo con dos ejemplos específicos usando cópulas Clayton
Glen_b -Reinstate Monica
Fabuloso, gracias! Un agradecimiento especial por el código R.
mww
Agregué un tercer ejemplo y al final delineo una forma de obtener algo como lo que estaba intentando originalmente: una forma de obtener una correlación ajustable entre -1 y 1 (aparte de los casos especiales en los extremos), pero para los cuales La suma no es normal.
Glen_b -Reinstate Monica
-1

Se me ocurrió un ejemplo. X es una variable normal estándar e Y = -X. Entonces X + Y = 0, que es constante. ¿Alguien puede confirmar que es un contraejemplo?

Sabemos que si X, Y son conjuntamente normales, su suma también es normal. Pero, ¿y si su correlación es -1?

Estoy un poco confundido sobre esto. Gracias.

Zirui Zhang
fuente
Obtiene lo mismo cuando X = Y y luego XY = 0. Estas son distribuciones normales que no son bivariadas normales. Por lo tanto, la propiedad de que las combinaciones lineales son normales que se aplica a la normal bivariada no necesita aplicarse.
Michael R. Chernick
σ0