Estoy pensando en la creación de interfaces de MATLAB y R a Ross Quinlan 's C5.0 (para aquellos que no están familiarizados con ella, C5.0 es un paquete algoritmo de árbol de decisión y el software; una extensión de C4.5 ), y yo estoy tratando de tener una idea de los componentes que necesitaría escribir.
La única documentación que encontré para C5.0 está aquí , que es un tutorial para See5 (¿una interfaz de Windows para C5.0?). El archivo tar viene con un Makefile, pero no hay archivos Léame ni documentación adicional.
Por lo que leí en el tutorial anterior, C5.0 usa una representación basada en ASCII para manejar entradas y salidas, y también estoy considerando construir una interfaz que pase datos binarios directamente entre MATLAB o R y C5.0. ¿La representación de datos de C5.0 es utilizada por algún otro software de aprendizaje automático / clasificación?
¿Alguien ha intentado construir una interfaz MATLAB o R para ID3, C4.5 o C5.0 antes?
Gracias
fuente
Respuestas:
Eso suena como una gran idea, especialmente porque la página a la que enlaza muestra que C5.0 ahora está bajo GPL.
Tengo cierta experiencia envolviendo el software C / C ++ a R usando Rcpp ; Me gustaría ayudar.
fuente
La interfaz del código C / C ++ con MATLAB es bastante sencilla, todo lo que tiene que hacer es crear una función de puerta de enlace MEX para manejar la conversión de parámetros y los parámetros de retorno. Tengo experiencia en hacer archivos MEX para hacer este tipo de cosas y estaría encantado de ayudar.
fuente
ACTUALIZAR:
Ahora en CRAN:
http://cran.r-project.org/web/packages/C50/index.html
ORIGINAL:
Hemos estado trabajando en esto por un tiempo ahora (comenzando con Cubist y luego trabajando en C5.0).
Si desea contribuir:
https://r-forge.r-project.org/projects/rulebasedmodels/
fue creado recientemente y deberíamos revisar el código inicial.
Hemos tenido acceso a las fuentes cubistas desde hace un tiempo (pero hubo un acuerdo explícito de no vincularlo con otros sw) y hemos estado debatiendo las diferentes opciones para incorporar el código, pero creo que
fuente
La documentación de C5.0 (Linux) está en http://rulequest.com/see5-unix.html
fuente