Estadísticas y Big Data

50
¿Cuál es la intuición detrás de SVD?

He leído sobre la descomposición de valores singulares (SVD). En casi todos los libros de texto se menciona que factoriza la matriz en tres matrices con especificación dada. Pero, ¿cuál es la intuición detrás de dividir la matriz en tal forma? PCA y otros algoritmos para la reducción de...

49
Bootstrap contra navaja

Los métodos bootstrap y jackknife se pueden usar para estimar el sesgo y el error estándar de una estimación, y los mecanismos de ambos métodos de remuestreo no son muy diferentes: el muestreo con reemplazo frente a omitir una observación a la vez. Sin embargo, jackknife no es tan popular como...

49
¿Es engañosa la "calificación promedio" de Amazon?

Si entiendo correctamente, las clasificaciones de libros en una escala de 1-5 son puntajes Likert. Es decir, un 3 para mí puede no ser necesariamente un 3 para otra persona. Es una escala ordinal de la OMI. Uno realmente no debería promediar escalas ordinales, pero definitivamente puede tomar la...

49
Tiempo de computación forestal aleatorio en R

Estoy usando el paquete de fiesta en R con 10,000 filas y 34 características, y algunas características de factor tienen más de 300 niveles. El tiempo de computación es demasiado largo. (Ha tomado 3 horas hasta ahora y aún no ha terminado). Quiero saber qué elementos tienen un gran efecto en el...