Construyendo interfaces MATLAB y R para C5.0 de Ross Quinlan

10

Estoy pensando en la creación de interfaces de MATLAB y R a Ross Quinlan 's C5.0 (para aquellos que no están familiarizados con ella, C5.0 es un paquete algoritmo de árbol de decisión y el software; una extensión de C4.5 ), y yo estoy tratando de tener una idea de los componentes que necesitaría escribir.

La única documentación que encontré para C5.0 está aquí , que es un tutorial para See5 (¿una interfaz de Windows para C5.0?). El archivo tar viene con un Makefile, pero no hay archivos Léame ni documentación adicional.

Por lo que leí en el tutorial anterior, C5.0 usa una representación basada en ASCII para manejar entradas y salidas, y también estoy considerando construir una interfaz que pase datos binarios directamente entre MATLAB o R y C5.0. ¿La representación de datos de C5.0 es utilizada por algún otro software de aprendizaje automático / clasificación?

¿Alguien ha intentado construir una interfaz MATLAB o R para ID3, C4.5 o C5.0 antes?

Gracias

Amelio Vazquez-Reina
fuente
¿Este proyecto continúa? Intenté instalar el paquete C5.0 en R, pero fallé.
¿Alguna vez hiciste una implementación de C5 para Matlab? Si lo hicieras, sería extremadamente útil. Estoy mirando la interfaz de C5 con Matlab en este momento, pero C5 parece un poco desordenado (no puede simplemente pasar archivos de texto desde y hacia él, ya que utiliza un formato difícil).
dcm29

Respuestas:

11

Eso suena como una gran idea, especialmente porque la página a la que enlaza muestra que C5.0 ahora está bajo GPL.

Tengo cierta experiencia envolviendo el software C / C ++ a R usando Rcpp ; Me gustaría ayudar.

Dirk Eddelbuettel
fuente
1
Muchas gracias por ofrecerte a ayudar. Tenemos un par de estudiantes en nuestro laboratorio que pueden investigar esto. Le informaremos tan pronto como resolvamos las cosas :)
Amelio Vazquez-Reina
5

La interfaz del código C / C ++ con MATLAB es bastante sencilla, todo lo que tiene que hacer es crear una función de puerta de enlace MEX para manejar la conversión de parámetros y los parámetros de retorno. Tengo experiencia en hacer archivos MEX para hacer este tipo de cosas y estaría encantado de ayudar.

Dikran Marsupial
fuente
¡eso suena genial! Gracias por estar dispuesto a ayudar. Tenemos un par de estudiantes en nuestro laboratorio y pueden comunicarse con usted si necesitamos ayuda.
Amelio Vazquez-Reina
4

ACTUALIZAR:

Ahora en CRAN:

http://cran.r-project.org/web/packages/C50/index.html

ORIGINAL:

Hemos estado trabajando en esto por un tiempo ahora (comenzando con Cubist y luego trabajando en C5.0).

Si desea contribuir:

https://r-forge.r-project.org/projects/rulebasedmodels/

fue creado recientemente y deberíamos revisar el código inicial.

Hemos tenido acceso a las fuentes cubistas desde hace un tiempo (pero hubo un acuerdo explícito de no vincularlo con otros sw) y hemos estado debatiendo las diferentes opciones para incorporar el código, pero creo que

topepo
fuente