¿Algún ejemplo de variables (aproximadamente) independientes que dependen de valores extremos?

14

Estoy buscando un ejemplo de 2 variables aleatorias , tal queXY

|cor(X,Y)|0

pero cuando se considera la parte de cola de las distribuciones, están altamente correlacionadas. (Intento evitar 'correlacionar' / 'correlación' para la cola porque podría no ser lineal).

Probablemente use esto:

|cor(X,Y)|0

donde X está condicionado a X>90% de la población de X e Y se define en el mismo sentido.

Kmz
fuente
8
¿Variables independientes que son dependientes? Mi cerebro simplemente explotó. No puede hacer este tipo de preguntas el lunes por la mañana
Aksakal
1
Dada la respuesta votada, esta Q parece responsable.
gung - Restablece a Monica
1
Para ayudar a que esto tenga sentido para las personas, considere cuánto le importan los problemas con las armas y cuánto le gusta / odia la NRA. La correlación probablemente será cercana a cero. Las personas que más se preocupan por los problemas con las armas pueden amar u odiar a la NRA. Pero serán muy dependientes. Las personas que más se preocupan por los problemas con las armas casi nunca estarán en el medio del espectro pro-NRA / anti-NRA. Las personas en el extremo superior o inferior del espectro pro-NRA / anti-NRA tenderán a preocuparse más por los problemas con las armas que las personas en el medio.
David Schwartz el
1
Perdón por decir la pregunta poco clara. Solo quiero visualizar cómo funciona para algunas distribuciones independientes que tienen un poco de dependencia extrema (no necesariamente correlación).
Kmz
2
Hay una gran cantidad de cópulas con una dependencia general débil pero una fuerte dependencia de la cola; la correlación general exacta se vería afectada por la distribución de los marginales.
Glen_b -Reinstale a Monica el

Respuestas:

23

Aquí hay un ejemplo donde e incluso tienen marginales normales.XY

Dejar:

XN(0,1)

Condicional a , deje si , o contrario, para alguna constante .XY=X|X|>ϕY=Xϕ

Puede mostrar que, independientemente de , marginalmente tenemos:ϕ

YN(0,1)

Hay un valor de tal que . Si entonces .ϕcor(X,Y)=0ϕ=1.54cor(X,Y)0

Sin embargo, e no son independientes, y los valores extremos de ambos son perfectamente dependientes. Vea la simulación en R a continuación, y la gráfica que sigue.XY

Nsim <- 10000
set.seed(123)

x <- rnorm(Nsim)
y <- ifelse(abs(x)>1.54,x,-x)

print(cor(x,y)) # 0.00284 \approx 0

plot(x,y)

extreme.x <- which(abs(x)>qnorm(0.95))
extreme.y <- which(abs(y)>qnorm(0.95))
extreme.both <- intersect(extreme.x,extreme.y)

print(cor(x[extreme.both],y[extreme.both])) # Exactly 1

ingrese la descripción de la imagen aquí

Chris Haug
fuente
1
(+1) Si desea que la distribución no solo no esté correlacionada, sino que no sea muy dependiente, puede hacer una modificación de esta que reemplace el intercambio de umbral duro por uno difuso. Eso es más difícil de alinear las matemáticas, pero es factible.
Matthew Graves el
1
Gracias Chris Haug! Tu idea me ayuda a visualizar lo que estoy haciendo.
Kmz