Me enfrenté a una distribución limitante con cero covarianza entre dos variables, pero su correlación es . ¿Existe tal distribución? ¿Cómo se puede explicar?
Tienes razón, necesito dar más detalles. OK, X e Y son distribución normal bivariada con diferentes varianzas y medias (sin n) pero corr = 1- (1 / n), ahora investigue la distribución limitante de Yn | Xn = x.
Respuestas:
Después de una aclaración de la OP, parece que a) suponemos que las dos variables siguen conjuntamente una normal bivariada yb) nuestro interés está en la distribución condicional, que es entonces
Entonces vemos eso comon → ∞ , tenemos ρnorte→ 1 , y la varianza de la distribución condicional va a cero. Intuitivamente, si la correlación va a la unidad, "sabiendoX "es suficiente para" saber y " además.
Pero en ninguna parte de lo anterior obtenemos esoCov (Ynorte,Xnorte) es cero Incluso en el límite, la covarianza seguirá siendo igual aCov (Ynorte,Xnorte) →σyσX .
Tenga en cuenta que la covarianza condicional (y luego también la correlación condicional) siempre es cero, porque,
Esto sucede porque al examinarXnorte= x Hemos convertido una de las variables aleatorias en una constante, y las constantes no varían conjuntamente con nada.
fuente
Dado que la covarianza depende de la escala deX y Y y la correlación no (reescalada a
[−1,−1] ) es posible. Por ejemplo, si la varianza disminuye hacia cero:
SiX=Y y σ2x es la varianza de X , entonces limσ2x→0cov(X,Y)=0 y .limσ2x→0cor(X,Y)=1
Nota 1: cuando la correlación está estrictamente indefinida porque su denominador sería igual a 0.σ2x=0
fuente
Por lo que puedo ver (quizás fuera de algunas circunstancias especiales, pero no mencionas ninguna), no es posible.
La correlación es la covarianza dividida por el producto de las dos desviaciones estándar, por lo que si la covarianza es cero, la correlación es cero (cuando ambas desviaciones estándar no son cero) o indefinida (cuando al menos una desviación estándar es 0). No debe ser 1 cuando la covarianza es 0.
Espero que haya cometido algún error en su análisis o que su descripción no sea lo suficientemente clara para discernir la situación correctamente.
fuente
Probablemente tenga dificultades porque visualiza los datos como gaussianos.
Es posible que todos los datos representen el mismo punto (aunque sería redundante) y que tenga dos variables con diferentes nombres (alias entre sí) que comprenden los datos. Esto llevaría a una covarianza cero, y una correlación de 1 como fundamental, la covarianza representa la dispersión de los datos en el espacio de características, mientras que la correlación representa cuánto depende una variable de otra o el grado de influencia que tienen entre sí. Si los datos no se extienden, la covarianza debe ser cero.
NOTA Sin embargo, lo mejor que puede hacer con un conjunto de datos de este tipo es simplemente predecir que todos los puntos tienen la misma salida, lo que probablemente dará un alto sesgo
fuente