Hein
Hay muchas herramientas y bibliotecas con la funcionalidad disponible.
La elección depende de si desea utilizar una interfaz gráfica de usuario para su trabajo o si desea incrustarla en algún otro programa.
Herramientas de minería de datos independientes (hay ohters como WEKA con interfaz Java):
- Minero rápido
- naranja
- Sonajero gui para R
- KNIME
Basado en texto:
Libs:
- Scikit para Python
- Mahout en Hadoop
Si conoces un lenguaje de programación lo suficientemente bien, usaría una lib para ese lenguaje o probaría R. Si no, puede probar una de las herramientas con gui.
Un ejemplo de árbol en R:
# we are using the iris dataset
data(iris)
# for our tree based model we use the rpart package
# to download it type install.packages("rpart")
library(rpart)
# Building the tree
fit <- rpart(Species ~ Petal.Length + Petal.Width, method="class", data=iris)
# Plot the tree
plot(fit)
text(fit)
Como se sugirió, el análisis con R requiere que usted se codifique, pero encontrará un paquete para la mayoría de las tareas de clasificación que funcionará de inmediato. Puede encontrar una descripción general aquí Vista de tareas de aprendizaje automático
Para comenzar a usar RapidMinder, debe echar un vistazo a Youtube. Hay algunos screencasts, incluso para árboles de decisión.
Weka es un conjunto de herramientas de aprendizaje automático gratuito y de código abierto. Tienen una GUI y una API para llamar desde su código Java si lo desea.
Tienen muchos algoritmos de clasificación, incluidos varios algoritmos de árbol de decisión. Estos están disponibles en la interfaz de usuario. Los vecinos más cercanos son un poco más complicados y parece que tienes que usar la API directamente .
Creo que Rapid Miner probablemente es compatible con este tipo de cosas, pero no lo he usado para tales fines antes.
También puede considerar R , pero eso puede requerir que sus manos estén un poco más sucias.
Tenga en cuenta que Netflix ha hecho un montón de trabajo en la clasificación de clasificación de películas. Hace varios años ofrecieron un premio de $ 1 millón al grupo que podría mejorar su clasificación al máximo. Quizás le interese leer cómo varios equipos abordaron ese problema.
fuente
Puede ser ... WEKA? http://www.cs.waikato.ac.nz/ml/weka/
fuente