Preguntas etiquetadas con r

9
Diferencia entre interpolar () y fillna () en pandas

Dado que el método interpolar y llenar hace el mismo trabajo de llenar valores n. ¿Cuál es la diferencia básica entre los dos? ¿Cuál es el significado de tener estos dos métodos diferentes? ¿Alguien puede explicarme en términos simples? Ya visité la documentación oficial y quería saber la...

8
Tutorial de aprendizaje automático en línea

¿Alguien sabe algunos buenos tutoriales sobre técnicas de aprendizaje automático en línea? Es decir, cómo se puede usar en entornos en tiempo real, cuáles son las diferencias clave en comparación con los métodos normales de aprendizaje automático, etc. UPD: Gracias a todos por las respuestas, por...

8
Error de R al usar el paquete tm (minería de texto)

Estoy intentando usar el paquete tm para convertir un vector de cadenas de texto en un elemento de corpus. Mi código se parece a esto Corpus(d1$Yes) donde d1$Yeses un factor con 124 niveles, cada uno con una cadena de texto. Por ejemplo, d1$Yes[246] = "So we can get the boat out!" Recibo el...

8
visualizar un diagrama de caja horizontal en R

Tengo un conjunto de datos como este. Los datos se han recopilado a través de un cuestionario y voy a hacer un análisis exploratorio de datos. windows <- c("yes", "no","yes","yes","no") sql <- c("no","yes","no","no","no") excel <- c("yes","yes","yes","no","yes") salary <-...

8
Clasificación de correo electrónico en R

Estoy trabajando en un proyecto en R donde tengo aproximadamente 1200 correos electrónicos de una empresa, la mayoría de los cuales están etiquetados como clase o clase , que son los tipos de solicitudes. Aproximadamente 1000 correos electrónicos están etiquetados como clase , y 200 están...

8
Consejos para un nuevo científico de datos

Estoy a punto de comenzar un trabajo en el que trabajaré con grandes conjuntos de datos y se esperará que encuentre tendencias, etc. He encontrado muchos recursos sobre dónde aprender ML y otras habilidades difíciles y siento que estoy (semi ) competente en este extremo. Estoy interesado en saber...

8
Ganancia de información en R

Encontré paquetes que se utilizan para calcular la "Ganancia de información" para seleccionar los atributos principales en el Árbol de decisiones C4.5 y traté de usarlos para calcular la "Ganancia de información". Pero los resultados del cálculo de cada paquete son diferentes como el código a...