Tengo varios cientos de medidas. Ahora, estoy considerando utilizar algún tipo de software para correlacionar cada medida con cada medida. Esto significa que hay miles de correlaciones. Entre estos debería haber (estadísticamente) una alta correlación, incluso si los datos son completamente aleatorios (cada medida tiene solo unos 100 puntos de datos).
Cuando encuentro una correlación, ¿cómo incluyo en ella la información sobre qué tanto busqué una correlación?
No estoy en un nivel alto en estadísticas, así que tengan paciencia conmigo.
R
en esta máquina tarda 18 segundos en obtener 1000 realizaciones de la distribución de permutación nula del coeficiente de correlación máximo para una matriz de 300 por 100x
:correl <- function(x, k=1) { n <- dim(x)[2] * (dim(x)[2]-1) / 2; v <- cor(x); sort(v[lower.tri(v)])[(n-k+1):n] }; sim <- replicate(1000, correl(apply(x,2,sample)))