Estadísticas y Big Data

26
Estimando el mismo modelo sobre múltiples series de tiempo

Tengo experiencia como novato en series de tiempo (algunas estimaciones / pronósticos de ARIMA) y estoy enfrentando un problema que no entiendo completamente. Cualquier ayuda sería muy apreciada. Estoy analizando múltiples series de tiempo, todas en el mismo intervalo de tiempo y todas con la...

26
¿Cómo calcular SVD de una enorme matriz dispersa?

¿Cuál es la mejor manera de calcular la descomposición de valores singulares (SVD) de una matriz positiva muy grande (65M x 3.4M) donde los datos son extremadamente escasos? Menos del 0.1% de la matriz no es cero. Necesito una forma que: cabe en la memoria (sé que existen métodos en línea) se...

26
¿Existe un "hola, mundo" para los gráficos estadísticos?

En la programación de computadoras, hay un primer programa clásico para aprender / enseñar un nuevo lenguaje o sistema, llamado "hola, mundo". http://en.wikipedia.org/wiki/Hello_world_program ¿Existe una primera visualización de datos clásica para usar un paquete de gráficos? Si es así, ¿qué es? Y...

26
Estimar el cuantil de valor en un vector

Tengo un conjunto de números reales. Necesito estimar el cuantil de un nuevo número. ¿Hay alguna forma limpia de hacer esto en R? ¿en general? Espero que esto no sea ultra trivial ;-) Muy apreciado por su

26
¿En qué se diferencia el centroide de la media?

Al realizar la agrupación jerárquica, se pueden usar muchas métricas para medir la distancia entre las agrupaciones. Dos de estas métricas implican el cálculo de los centroides y las medias de los puntos de datos en los grupos. ¿Cuál es la diferencia entre la media y el centroide? ¿No son estos el...