Vinculado para la correlación de tres variables aleatorias

28

Hay tres variables aleatorias, . Las tres correlaciones entre las tres variables son las mismas. Es decir,x,y,z

ρ=cor(x,y)=cor(x,z)=cor(y,z)

¿Cuál es el límite más ajustado que puede dar por ?ρ

usuario1352399
fuente
1
Presumiblemente por "pho", te refieres a rho ( ). Sin embargo, su pregunta no está clara. ¿Qué quieres decir con "¿Cuál es el límite más fuerte que puedes dar"? ρ
gung - Restablece a Monica
Bueno, el nombre de la variable es solo un maniquí. Por límite más estricto, quiero decir algo así como [-1, 1] para una correlación, pero claramente este no es el límite más estricto posible.
user1352399
¿Quiere decir que rho = cor (x, y) = cor (x, z) = cor (y, z), y cuáles son los límites para rho?
user31264
Sí, quiero decir que rho = cor (x, y) = cor (x, z) = cor (y, z) y cuáles son los límites para rho. Dilip, ¿puedes extender eso para decir que rho debe ser no negativo, es decir,> = 0?
user1352399
1
Un libro de texto para citar esto es el "Análisis de regresión lineal" de Seber & Lee (al menos fue en la primera edición ...)
kjetil b halvorsen

Respuestas:

29

La correlación común puede tener un valor pero no . Si , entonces no puede ser igual a pero en realidad es . El valor más pequeño de la correlación común de tres variables aleatorias es . De manera más general, la correlación mínima común de variables aleatorias es cuando, consideradas como vectores, están en los vértices de un símplex (de dimensión ) en un espacio -dimensional.ρ+11ρX,Y=ρX,Z=1ρY,Z1+112n1n1n1n

Considere la varianza de la suma de variables aleatorias de varianza unitaria X i . Tenemos esa var ( n i = 1 X i )nXi donde ˉ ρ es elvalor promediode ( n

var(i=1nXi)=i=1nvar(Xi)+i=1njincov(Xi,Xj)=n+i=1njinρXi,Xj(1)=n+n(n1)ρ¯
ρ¯ coeficientes de correlación. Pero comovar(iXi)0, obtenemos fácilmente de (1)que ˉ ρ-1(n2)var(iXi)0(1)
ρ¯1n1.

Entonces, el valor promedio de un coeficiente de correlación es al menos . Sitodoslos coeficientes de correlación tienen elmismovalorρ, entonces su promedio también es igual aρy entonces tenemos que ρ-11n1ρρ ¿Es posible tener variables aleatorias para las cuales el valor de correlación comúnρes igual a-1

ρ1n1.
ρ ? Sí. Suponga queXison variables aleatorias de varianza unitariano correlacionadasy establezca Yi=Xi-11n1Xi . Entonces,E[Yi]=0, mientras que var(Yi)= ( n - 1Yi=Xi1nj=1nXj=XiX¯E[Yi]=0 y cov(Yi,Yj)=-2(n-1
var(Yi)=(n1n)2+(n1)(1n)2=n1n
dando ρYi,Yj=cov(Yi,Yj)
cov(Yi,Yj)=2(n1n)(1n)+(n2)(1n)2=1n
Así, laYison variables aleatorias que alcanzan el valor de correlación común mínimo de-1
ρYi,Yj=cov(Yi,Yj)var(Yi)var(Yj)=1/n(n1)/n=1n1.
Yi . Nota, por cierto, que ΣiYi=0, y así, considerado como vectores, las variables aleatorias se encuentran en un(n-1)hiperplano -dimensional denespacio -dimensional.1n1iYi=0(n1)n
Dilip Sarwate
fuente
25

El más apretado posible cota es . 1/2ρ1 Todos estos valores pueden aparecer realmente, ninguno es imposible.

Para mostrar que no hay nada especialmente profundo o misterioso sobre el resultado, esta respuesta presenta primero una solución completamente elemental, que requiere solo el hecho obvio de que las variaciones, que son los valores esperados de los cuadrados, no deben ser negativas. Esto es seguido por una solución general (que utiliza hechos algebraicos ligeramente más sofisticados).

Solución elemental

La varianza de cualquier combinación lineal de debe ser no negativa. x,y,z Vamos a las varianzas de estas variables es y nu 2 , respectivamente. Todos son distintos de cero (de lo contrario, algunas correlaciones no se definirían). Usando las propiedades básicas de las variaciones, podemos calcularσ2,τ2,υ2

0Var(αx/σ+βy/τ+γz/υ)=α2+β2+γ2+2ρ(αβ+βγ+γα)

para todos los números reales .(α,β,γ)

Suponiendo que , una pequeña manipulación algebraica implica que esto es equivalente aα+β+γ0

ρ1ρ13((α2+β2+γ2)/3(α+β+γ)/3)2.

(α,β,γ)(1/3,1/3,1/3)11α=β=γ0

ρ1/2.

n=3(x,y,z)1/2ρ1

Solución general

Visión general

ρ1/21ρ


ρ

nnρ.n=3,C(ρ,n).λxλ

C(ρ,n)xλ=λxλ.

Estos valores propios son fáciles de encontrar en el presente caso, porque

  1. 1=(1,1,,1)

    C(ρ,n)1=(1+(n1)ρ)1.
  2. yj=(1,0,,0,1,0,,0)1jthj=2,3,,n

    C(ρ,n)yj=(1ρ)yj.

nnn1+(n1)ρ1ρn11ρ1 satisfecho por todas las correlaciones, la no negatividad del primer valor propio implica además

ρ1n1

mientras que la no negatividad del segundo valor propio no impone nuevas condiciones.


Prueba de suficiencia de las condiciones.

1/(n1)ρ1,C(ρ,n)

Σ(ρ,n)=(1+(n1)ρ)Inρ(1ρ)(1+(n1)ρ)11

C(ρ,n)1/(n1)<ρ<1.n=3

Σ(ρ,3)=1(1ρ)(1+2ρ)(ρ+1ρρρρ+1ρρρρ+1).

(X1,X2,,Xn)

fρ,n(x)=exp(12xΣ(ρ,n)x)(2π)n/2((1ρ)n1(1+(n1)ρ))1/2

x=(x1,x2,,xn)n=3

1(2π)3(1ρ)2(1+2ρ)exp((1+ρ)(x2+y2+z2)2ρ(xy+yz+zx)2(1ρ)(1+2ρ)).

nC(ρ,n).

Figura

fρ,3.ρ=4/10,0,4/10,8/10x+y+z=0x=y=z

ρ=1/(n1)ρ=1x.1=0010


Más acerca de la no degeneración

C(1/(n1),n)n1C(1,n)1n2Σ(ρ,n)

whuber
fuente
20

Su matriz de correlación es

(1ρρρ1ρρρ1)

La matriz es positiva semidefinida si los principales principales menores no son todos negativos. Los principales menores son los determinantes de los bloques "noroeste" de la matriz, es decir, 1, el determinante de

(1ρρ1)

y el determinante de la matriz de correlación en sí.

1ρ2ρ[1,1]

2ρ33ρ2+1.

[1,1]ingrese la descripción de la imagen aquí

Verá que la función no es negativa en el rango dado por @stochazesthai (que también puede verificar encontrando las raíces de la ecuación determinante).

Christoph Hanck
fuente
Var()=1
1
@Anold Parece que estás leyendo "covarianza" donde se escribe "correlación".
whuber
6

XYZρXY=ρYZ=ρXZ=ρρ[12,1]

Stochazesthai
fuente
2
¿Puedes explicar esto en términos muy simples?
Elizabeth Susan Joseph
1
No creo que exista una explicación que no requiera el conocimiento del álgebra matricial. Le sugiero que consulte la página de Wikipedia ( en.wikipedia.org/wiki/… ).
stochazesthai
44
Encontré una explicación que requiere solo álgebra básica (nivel secundario) y la he incluido en mi respuesta.
whuber