Ciencia de los datos

13
¿Hay alguna API para rastrear el resumen de papel?

Si tengo una lista muy larga de nombres de artículos, ¿cómo podría obtener un resumen de estos documentos de Internet o de cualquier base de datos? Los nombres de los trabajos son como "Evaluación de la utilidad en la minería web para el dominio de la salud pública". ¿Alguien sabe alguna API que...

13
Estudio de caso de Big Data o ejemplo de caso de uso

He leído muchos blogs \ artículos sobre cómo diferentes tipos de industrias están utilizando Big Data Analytic. Pero la mayoría de estos artículos no menciona Qué tipo de datos usaron estas compañías. ¿Cuál fue el tamaño de los datos? ¿Qué tipo de herramientas tecnológicas utilizaron para...

13
Conjuntos de datos que comprenden las mejores prácticas

Soy un estudiante de maestría de CS en minería de datos. Mi supervisor me dijo una vez que antes de ejecutar cualquier clasificador o hacer algo con un conjunto de datos, debo entender completamente los datos y asegurarme de que estén limpios y correctos. Mis preguntas: ¿Cuáles son las mejores...

13
Escalado de datos de forma ética y rentable

Pocas cosas en la vida me dan placer, como extraer datos estructurados y no estructurados de Internet y utilizarlos en mis modelos. Por ejemplo, el Data Science Toolkit (o RDSTKpara los programadores de R) me permite extraer muchos datos buenos basados ​​en la ubicación utilizando IP o...

13
Neo4j vs OrientDB vs Titán

Estoy trabajando en un proyecto de ciencia de datos relacionado con la minería de relaciones sociales y necesito almacenar datos en algunas bases de datos de gráficos. Inicialmente elegí Neo4j como la base de datos. Pero parece que Neo4j no escala bien. La alternativa que descubrí son Titan y...