Digamos que pruebo cómo la variable Y
depende de la variable X
en diferentes condiciones experimentales y obtengo el siguiente gráfico:
Las líneas discontinuas en el gráfico anterior representan una regresión lineal para cada serie de datos (configuración experimental) y los números en la leyenda denotan la correlación de Pearson de cada serie de datos.
Me gustaría calcular la "correlación promedio" (o "correlación media") entre X
y Y
. ¿Puedo simplemente promediar los r
valores? ¿Qué pasa con el "criterio de determinación promedio", ? ¿Debería calcular el promedio y luego tomar el cuadrado de ese valor o debería calcular el promedio de 's individuales ?R 2r
fuente
Para los coeficientes de correlación de Pearson, generalmente es apropiado transformar los valores de r usando una transformación de Fisher z . Luego promedie los valores z y convierta el promedio nuevamente en un valor r .
Me imagino que también estaría bien para un coeficiente de Spearman.
Aquí hay un artículo y la entrada de wikipedia .
fuente
La correlación promedio puede ser significativa. Considere también la distribución de correlaciones (por ejemplo, trazar un histograma).
Pero, según tengo entendido, para cada individuo tiene una clasificación de elementos más clasificaciones predichas de esos elementos para ese individuo, y está observando la correlación entre las clasificaciones de un individuo y las predichas.n
En este caso, puede ser que la correlación no sea la mejor medida de qué tan bien el algoritmo está haciendo predicciones. Por ejemplo, imagine que el algoritmo obtiene los primeros 100 elementos a la perfección y los siguientes 200 elementos están totalmente en mal estado, frente a lo contrario. Podría ser que solo te preocupes por la calidad de los mejores rankings. En este caso, puede observar la suma de las diferencias absolutas entre la clasificación del individuo y la clasificación pronosticada, pero solo entre los principales elementos del individuo .m
fuente
¿Qué pasa con el uso de error medio de predicción al cuadrado (MSPE) para el rendimiento del algoritmo? Este es un enfoque estándar de lo que está tratando de hacer, si está tratando de comparar el rendimiento predictivo entre un conjunto de algoritmos.
fuente