¿Existe un principio general sobre si uno debe calcular la correlación de Pearson para dos variables aleatorias X e Y antes de tomar su transformación logarítmica o después? ¿Existe un procedimiento para probar cuál es más apropiado? Producen valores similares pero diferentes, ya que la transformación logarítmica es no lineal. ¿Depende de si X o Y están más cerca de la normalidad después del registro? Si es así, ¿por qué importa eso? ¿Y eso significa que uno debe hacer una prueba de normalidad en X e Y versus log (X) y log (Y) y en base a eso decidir si pearson (x, y) es más apropiado que pearson (log (x), log ( y))?
regression
correlation
logarithm
pearson-r
usuario9097
fuente
fuente
Respuestas:
fuente
La correlación (pearson) mide una relación lineal entre dos variables continuas. No existe tal opción para (X, Y) o (log X, log Y). El diagrama de dispersión de las variables se puede utilizar para comprender la relación.
El siguiente enlace puede responder con respecto al problema de normalidad. enlace
fuente
La correlación de Pearson es para pruebas paramétricas y es más poderosa que la prueba sin parametirc. Por lo tanto, optamos por utilizar la transformación antes de cualquier procedimiento no paramétrico. Transforme sus datos y obtenga la correlación de Pearson. Eso es.
fuente