Comparación de coeficientes de correlación

11

Tengo dos conjuntos de datos donde tengo ~ 250,000 valores para 78 y 35 muestras. Algunas de las muestras son miembros de una familia y esto puede tener un efecto en los datos. He calculado la correlación por pares y varía entre 0.7 y 0.95, pero me gustaría saber si hay una diferencia significativa en los coeficientes de correlación intra vs interfamiliares. ¿Cuál es la mejor manera de hacer esto? Gracias

biomed
fuente

Respuestas:

6

De una manera general para comparar dos coeficientes de correlación rho 1 , ρ 2 es utilizar transformada z método de Fisher, que dice que un r c t un n h ( ρ ) es aproximadamente normal con media un r c t un n h ( ρ ) y desviación estándar 1 / ρ^1,ρ^2unarCtunanorteh(ρ^)unarCtunanorteh(ρ) . Si las muestras son independientes, entonces transforma cada coeficiente de correlación y la diferencia entre las dos correlaciones transformadas será normal conunamediaarctanh(ρ 1 )-arctanh(ρ 2 )y estándar desviación1/ /norte-3unarCtunanorteh(ρ1)-unarCtunanorteh(ρ2) . A partir de esto, puede formar unaestadísticazy hacer pruebas como lo haría en unapruebazordinaria de dos muestras.1/ /(norte1-3)+1/ /(norte2-3)zz

Macro
fuente
2

Aunque la respuesta de @ Macro es buena, requiere una suposición sobre la (in) dependencia de las estadísticas. Otro enfoque sería usar bootstrapping. La idea sería mantener una variable fija y mezclar la otra variable, calcular la correlación para cada una de sus muestras y tomar la diferencia. Repita muchas veces para obtener una distribución y use esta distribución para probar la hipótesis de que las correlaciones son las mismas. La estructura de su conjunto de datos no es tan clara para mí, por lo que es difícil proporcionar más detalles.

Charlie
fuente