¿Cómo uso un filtro de palabras clave personalizado en la API Java Weka?

8

Estoy usando la API Java Weka para construir un modelo de clasificación. Puedo usar el filtro incorporado de palabras clave. Sin embargo, necesito usar un filtro personalizado para mi problema. No sé cómo usar un filtro de palabras clave personalizado en la API Java Weka.

Radia Karim
fuente

Respuestas:

7

Puedes probar el siguiente código.

import weka.core.converters.ConverterUtils.DataSource;
import weka.filters.unsupervised.attribute.StringToWordVector;
import weka.core.Instances;

Instances data = DataSource.read(".../document.txt"); //Your document .
filter.setInputFormat(data);
StringToWordVector filter = new StringToWordVector();
filter.setStopwords(new File(".../stopwords.txt")); //stop words file.
Instances data = Filter.useFilter(data,filter);

También puede leer el siguiente documento para comprender mejor la API de Weka para Java. http://weka.sourceforge.net/doc.stable/

Howa Begum
fuente
Aprecio tu apoyo. Muchas gracias. Su código y el enlace del documento realmente me ayudan mucho.
Radia Karim
7

En primer lugar, debe preparar un archivo de texto para sus palabras clave personalizadas. Entonces puedes usar el siguiente código:

import weka.filters.unsupervised.attribute.StringToWordVector;

StringToWordVector filter = new StringToWordVector(10000);
filter.setStopwords(new File(".../stopwords.txt"));

Espero que te ayude.

Rejaul Karim
fuente
Aprecio tu apoyo.
Radia Karim
Soy muy nuevo en la programación Java weka-api. No lo entiendo claramente. Alguien, por favor, dame una respuesta un poco más elaborada. Gracias de antemano por su apoyo.
Radia Karim
Por favor, háganos saber qué parte no entiende?
Rejaul Karim