Esto es principalmente curiosidad, pero ¿hay implementaciones de OCR en Java puro? Tengo curiosidad por saber cómo funcionaría esto exclusivamente en Java, y el OCR en general me interesa, así que me encantaría ver cómo se implementa en un lenguaje que entiendo completamente. Naturalmente, esto requeriría que la implementación sea de código abierto, pero todavía estoy interesado en soluciones propietarias, ya que al menos podría verificar el rendimiento en ese caso.
He visto un par que se puede usar en Java (como Asprise ) pero no parece que estas sean implementaciones de Java puro ... ¿hay alguna?
Respuestas:
Recomiendo probar el proyecto Java OCR en sourceforge.net. Originalmente lo desarrollé y tengo una publicación en el blog .
Desde que lo puse en sourceforge, su funcionalidad se ha ampliado y mejorado bastante gracias al gran trabajo de un investigador / desarrollador voluntario.
Pruébalo, y si no te gusta, ¡siempre puedes mejorarlo!
fuente
Hemos probado algunos motores OCR con Java como Tesseract, Asprise, Abbyy, etc. En nuestro análisis, Abbyy dio los mejores resultados.
fuente
ProcessBuilder
.Si está buscando una opción muy extensible o tiene un dominio de problema específico, podría considerar la opción de usar el motor neuronal orientado a objetos Java . Otra referencia de JOONE .
Lo utilicé con éxito en un proyecto personal para identificar la letra de una imagen como esta , puede encontrar toda la fuente del componente OCR de mi aplicación en github, aquí .
fuente
Hay una variedad de bibliotecas de OCR por ahí. Sin embargo, mi experiencia es que las principales implementaciones comerciales, ABBYY, Omnipage y ReadIris, superan con creces las implementaciones de código abierto u otras implementaciones menores. Estas bibliotecas comerciales no están diseñadas principalmente para funcionar con Java, aunque, por supuesto, es posible.
Por supuesto, si su interés es aprender el código, las implementaciones de código abierto harán el truco.
fuente
Acabo de encontrar este (no lo sé, no probado, compruébalo tú mismo)
Ron Cemer Java OCR
Como solo necesita esto por curiosidad, puede buscar en la fuente de este applet.
Hace OCR de caracteres escritos a mano con una red neuronal
Java OCR: reconocimiento de escritura a mano
fuente