Preguntas etiquetadas con data-mining

13
¿Hay alguna API para rastrear el resumen de papel?

Si tengo una lista muy larga de nombres de artículos, ¿cómo podría obtener un resumen de estos documentos de Internet o de cualquier base de datos? Los nombres de los trabajos son como "Evaluación de la utilidad en la minería web para el dominio de la salud pública". ¿Alguien sabe alguna API que...

13
Neo4j vs OrientDB vs Titán

Estoy trabajando en un proyecto de ciencia de datos relacionado con la minería de relaciones sociales y necesito almacenar datos en algunas bases de datos de gráficos. Inicialmente elegí Neo4j como la base de datos. Pero parece que Neo4j no escala bien. La alternativa que descubrí son Titan y...

13
Estudio de caso de Big Data o ejemplo de caso de uso

He leído muchos blogs \ artículos sobre cómo diferentes tipos de industrias están utilizando Big Data Analytic. Pero la mayoría de estos artículos no menciona Qué tipo de datos usaron estas compañías. ¿Cuál fue el tamaño de los datos? ¿Qué tipo de herramientas tecnológicas utilizaron para...

12
Tarifas de aerolíneas: ¿qué análisis se debe utilizar para detectar comportamientos competitivos de fijación de precios y correlaciones de precios?

Quiero investigar el comportamiento de fijación de precios de las aerolíneas, específicamente cómo las aerolíneas reaccionan a los precios de la competencia. Como diría, mi conocimiento sobre análisis más complejos es bastante limitado. He realizado principalmente todos los métodos básicos para...

11
Raspado web de LinkedIn

Recientemente descubrí un nuevo paquete R para conectarse a la API de LinkedIn. Desafortunadamente, la API de LinkedIn parece bastante limitada para empezar; por ejemplo, solo puede obtener datos básicos sobre empresas, y esto se separa de los datos sobre individuos. Me gustaría obtener datos sobre...

11
¿Hay algún buen modelo de lenguaje listo para usar para Python?

Estoy creando prototipos de una aplicación y necesito un modelo de lenguaje para calcular la perplejidad en algunas oraciones generadas. ¿Hay algún modelo de lenguaje entrenado en Python que pueda usar fácilmente? Algo simple como model = LanguageModel('en') p1 = model.perplexity('This is a well...

11
Trabajando con clústeres HPC

En mi universidad, tenemos un clúster de computación HPC. Yo uso el clúster para entrenar clasificadores, etc. Entonces, por lo general, para enviar un trabajo al clúster (por ejemplo, script de python scikit-learn), necesito escribir un script de Bash que contenga (entre otros) un comando como...