Estadísticas y Big Data

8
Distancia métrica y maldición de dimensiones

En alguna parte leí una nota que si tienes muchos parámetros (X1,X2, ... ,Xnorte)(x1,x2,…,xn)(x_1, x_2, \ldots, x_n)e intenta encontrar una "métrica de similitud" entre estos vectores, puede tener una "maldición de la dimensionalidad". Creo que significó que la mayoría de los puntajes de similitud...

8
Documentos de minería de datos / ejemplos

Estoy buscando algunos documentos / sitios web de tamaño medio a largo sobre la minería de datos, específicamente donde se explora en profundidad un conjunto de datos desde la preparación de datos hasta el modelo final. Estoy particularmente interesado en las discusiones sobre la aplicación de...

8
¿De qué sirven las matrices densas en estadística?

OK, no soy un estadístico (ni siquiera cerca). Soy un investigador de computación de alto rendimiento y quería algunos casos de prueba para matrices densas grandes (mayores de 5000x5000). Había preguntado aquí y en algunos otros lugares, pero nunca recibí respuesta de un estadístico. Estoy muy...

8
Análisis factorial de comprensión

¿Puedo entender el análisis factorial de la siguiente manera? Supongamos que tengo 5 variables independientes (A, B, C, D, E) El análisis factorial me permite hacer que (D, E) sean variables dependientes y me permiten hacer que sean combinaciones lineales de (A, B, C). Por lo tanto, solo...

8
Intervalos de confianza para un polinomio

Tengo una variable aleatoria que toma valores en los enteros no negativos , llama a las probabilidades para cada resultado . Puedo tomar muestras de la distribución de independiente y económica; Actualmente tengo un tamaño de muestra de . Parece que , con una disminución aproximadamente...

8
Detección de forma para datos de series temporales

Tengo una gran colección de series de tiempo: mediciones tomadas cada 15 minutos (96 mediciones en un día) en el transcurso de 1 año en diferentes lugares. He dividido cada serie de tiempo en 365 series de tiempo más pequeñas, 1 para cada día del año. Mirando estas series de tiempo, ciertamente...