Ciencia de los datos

8
¿Cómo construir un motor de búsqueda textual?

Tengo una cadena HTML y quiero saber si una palabra que proporciono es relevante en esa cadena. La relevancia podría medirse según la frecuencia en el texto. Un ejemplo para ilustrar mi problema: this is an awesome bike store bikes can be purchased online. the bikes we own rock. check out our...

8
Agrupación de sindicatos en gráficos bipartitos?

Estoy tratando de encontrar una buena (y rápida) solución al siguiente problema: Tengo dos modelos con los que estoy trabajando, llamémosles jugadores y equipos. Un jugador puede estar en varios equipos y un equipo puede tener varios jugadores). Estoy trabajando en la creación de un elemento de...

8
Gráficos interactivos al registrar datos

Estoy buscando graficar y explorar interactivamente datos en vivo / medidos continuamente. Existen bastantes opciones, y plot.ly es la más fácil de usar. Plot.ly tiene una interfaz de usuario fantástica y fácil de usar (fácilmente escalable, panoramizable, fácilmente ampliable / ajustable a la...

8
Tutoriales sobre modelos de temas y LDA

Me gustaría saber si ustedes tienen algunos buenos tutoriales (rápidos y directos) sobre modelos de temas y LDA, enseñando intuitivamente cómo establecer algunos parámetros, qué significan y, si es posible, con algunos ejemplos

8
Trozos complejos con NLTK

Estoy tratando de descubrir cómo usar el troceador en cascada de NLTK según el Capítulo 7 del libro de NLTK . Desafortunadamente, me encuentro con algunos problemas al realizar medidas de fragmentación no triviales. Comencemos con esta frase: "adventure movies between 2000 and 2015 featuring...

8
visualizar un diagrama de caja horizontal en R

Tengo un conjunto de datos como este. Los datos se han recopilado a través de un cuestionario y voy a hacer un análisis exploratorio de datos. windows <- c("yes", "no","yes","yes","no") sql <- c("no","yes","no","no","no") excel <- c("yes","yes","yes","no","yes") salary <-...