Según tengo entendido, podemos obtener la correlación normalizando la covarianza usando la ecuación
donde es la desviación estándar deXi.
Mi preocupación es ¿qué pasa si la desviación estándar es igual a cero? ¿Hay alguna condición que garantice que no puede ser cero?
Gracias.
correlation
standard-deviation
covariance
chepukha
fuente
fuente
Respuestas:
Es cierto que, si una de sus SD es 0, esa ecuación no está definida. Sin embargo, una mejor manera de pensar en esto es que si una de sus SD es 0, no hay correlación. En términos conceptuales laxos, una correlación le dice cómo se mueve una variable a medida que se mueve la otra variable. Una SD de 0 implica que la variable no se está 'moviendo'. Tendría que tener un vector de una constante, como
rep(constant, n_times)
.fuente
La otra cosa a tener en cuenta son los supuestos subyacentes cuando hablamos de medias y desviaciones estándar y correlaciones.
Si estamos hablando de una muestra de datos, una suposición común es que los datos están (al menos aproximadamente) normalmente distribuidos, o pueden transformarse de manera tal que lo están (por ejemplo, a través de una transformación logarítmica). Si observa una desviación estándar de cero, hay dos escenarios: la desviación estándar es de hecho distinta de cero, pero muy pequeña y, por lo tanto, el conjunto de datos que tiene tiene muestras que están en el valor medio (esto podría suceder, por ejemplo). si está midiendo datos con un nivel de precisión aproximado); o el modelo está mal especificado.
En este segundo escenario, la desviación estándar y, en consecuencia, la correlación, es una medida sin sentido.
En términos más generales, las distribuciones subyacentes deben tener segundos momentos finitos y, por lo tanto, desviaciones estándar distintas de cero, para que la correlación sea un concepto válido.
fuente
A correlation is the cosine of the angle between two vectors. To say that the standard deviation for Y is zero is the same as saying that the vector Y-mean(Y) is zero (or, more rigorously, that it represents zero in the appropriate vector space). So the question becomes "What can one say about the (cosine of the) angle between the zero vector and the vector X-mean(X)?". More generally, in any vector space with an inner product, what is meant by the angle between the zero vector and some other vector? There's only one answer to this, in my opinion, and that is that the concept of "angle" in this situation is meaningless, and so the concept of correlation in this situation is meaningless.
fuente
Descargo de responsabilidad, me doy cuenta de que ya hay una respuesta de calidad aceptada, por lo que debería ser una respuesta, pero no tengo los puntos de experiencia para permitirla. @Dilip mencionó que puede definir la correlación como 0 para la convención, pero esto parece problemático ya que tendría una interpretación muy diferente de una correlación que es verdaderamente cero (con SD diferentes de cero). La pregunta original dice "si la SD de una variable es cero". Si nos detenemos y pensamos en la definición de 'variable', obtenemos un camino mucho más directo a la respuesta. Una variable con 0 SD no es una variable en absoluto, es una constante. Entonces, en ese caso, no tiene dos variables, por lo que conceptualmente no tiene sentido definir una correlación en absoluto.
fuente