Estadísticas y Big Data

8
Cómo tomar muestras de

En R, tengo un N×KN×KN \times K matriz PPP donde el iiila fila de PPP corresponde a una distribución en {1,...,K}{1,...,K}\{1, ..., K\}. Esencialmente, necesito tomar muestras de cada fila de manera eficiente. Una implementación ingenua es: X = rep(0, N); for(i in 1:N){ X[i] = sample(1:K, 1, prob...

8
¿Un enfoque gradual produce el modelo más alto ?

Cuando se utiliza el enfoque progresivo hacia adelante para seleccionar variables, ¿se garantiza que el modelo final tenga el más alto posible ? Dicho de otra manera, ¿el enfoque gradual garantiza un óptimo global o solo un óptimo local?R2R2R^2 Como ejemplo, si tengo 10 variables para seleccionar...

8
Reglas sencillas básicas para estadísticas

En un experimento binomial, si observamos x=0x=0x=0 individuo positivo entre nnn individuos, entonces la proporción de individuos positivos es significativamente menor que 3/n3/n3/n con un error de tipo 1 menor y muy cercano a 5%5%5\%. Este hecho, a veces llamado la "regla de tres", es una...

8
Bases del coeficiente de correlación de Pearson

El coeficiente de correlación de Pearson se calcula utilizando la fórmula . ¿Cómo contiene esta fórmula la información de que las dos variantes e están correlacionadas o no? O, ¿cómo obtenemos esta fórmula para el coeficiente de correlación?r =c o v ( X, Y)v a r ( X)√v a r (...