Preguntas etiquetadas con large-data

Los 'datos grandes' se refieren a situaciones en las que el número de observaciones (puntos de datos) es tan grande que necesita cambios en la forma en que el analista de datos piensa o realiza el análisis. (No debe confundirse con 'alta dimensionalidad').

44
¿Qué es exactamente Big Data?

En varias ocasiones me han hecho la pregunta: ¿Qué es Big-Data? Tanto por los estudiantes como por mis familiares que están recogiendo el rumor sobre las estadísticas y el aprendizaje automático. Encontré esta publicación de CV . Y siento que estoy de acuerdo con la única respuesta allí. La...

21
Primer paso para big data ( , )

Suponga que está analizando un gran conjunto de datos con miles de millones de observaciones por día, donde cada observación tiene un par de miles de variables numéricas y categoriales dispersas y posiblemente redundantes. Digamos que hay un problema de regresión, un problema de clasificación...

21
¿Cómo proyectar un nuevo vector en el espacio PCA?

Después de realizar el análisis de componentes principales (PCA), quiero proyectar un nuevo vector en el espacio PCA (es decir, encontrar sus coordenadas en el sistema de coordenadas PCA). He calculado PCA en lenguaje R usando prcomp. Ahora debería poder multiplicar mi vector por la matriz de...

18
Opciones de análisis de datos fuera del núcleo

He estado usando SAS profesionalmente durante casi 5 años. Lo tengo instalado en mi computadora portátil y con frecuencia tengo que analizar conjuntos de datos con 1,000-2,000 variables y cientos de miles de observaciones. He estado buscando alternativas a SAS que me permitan realizar análisis en...