Supongamos que tengo una gran población de puntos de datos y que la correlación de Pearson es
¿Qué puedo decir razonablemente sobre la correlación que espero observar en una muestra de tamaño ? Si la correlación de la muestra es , ¿cuál es aproximadamente la extensión es ? ¿ sesgado?
Si hacemos algunas suposiciones como la normalidad, ¿podemos calcular la función de probabilidad exacta de como una función de ?
(En última instancia, me pregunto sobre el problema de si una alta correlación observada es una casualidad o no, y todo lo que tengo es el tamaño de la muestra y la correlación).
correlation
Mark Eichenlaub
fuente
fuente
Respuestas:
Para citar el artículo de Wikipedia sobre la transformación de Fisher :
Si tiene una distribución normal bivariada, y si los pares ( X i , Y i ) utilizados para formar el coeficiente de correlación de la muestra r son independientes para i = 1 , ... , n , entonces z = 1( X, Y) ( Xyo, Yyo) r i = 1 , ... , n , se distribuye aproximadamente normalmente con la media
1
fuente