¿Hay alguna biblioteca OCR gratuita para Android? [cerrado]
148
Estoy buscando un OCR Java que se ejecute en Android, sin embargo, Asprise no parece ser un OCR independiente de la plataforma. ¿Hay algún OCR Java de código abierto / gratuito que pueda usar para el desarrollo de aplicaciones de Android?
OCR puede consumir bastante CPU, es posible que desee reconsiderar hacerlo en un teléfono inteligente.
Aparte de eso, que yo sepa, las bibliotecas populares de OCR son Aspire y Tesseract . Ninguno de los dos es Java, por lo que no obtendrá una biblioteca de OCR de Android.
Sin embargo, Tesseract es de código abierto (GitHub alojado de hecho); para que pueda dedicar algo de tiempo a portar el subconjunto que necesita a Java. Tengo entendido que no es una locura C ++, por lo que, dependiendo de cuánto necesite OCR, podría valer la pena.
Tan breve respuesta: No.
Respuesta larga: si estás dispuesto a trabajar por ello.
al portarlo, ¿te refieres a reescribir el subconjunto en Java? eso podría requerir mucho esfuerzo, por lo que no existe un OCR 100% Java.
user121196
13
Recomendaría intentar envolver Tesseract en una capa JNI a través de Android NDK, en lugar de intentar portarlo a Java de Android. Tesseract ya parece estar portado a ARM, por lo que debería ser más fácil colocar una API JNI encima. Además, esto lo mantiene más rápido (er) de lo que sería cualquier puerto Java, y simplificaría el mantenimiento a largo plazo.
Tesseract no será una caminata corta de C a Java. El código que he visto es altamente idiomático C de los 80 y no es fácilmente transportable a otros idiomas.
La pregunta se ha cerrado, pero es bueno encontrar a alguien que haya tenido resultados positivos. Es muy difícil encontrar personas en estos proyectos de tipo sourceforge. Pregunta: ¿probaste Tesseract con escaneos de imágenes de pasaportes o documentos de identidad? Parece estar bien con los PDF de texto, pero estoy luchando con las imágenes.
PKHunter
No lo intenté con nada que tuviera imágenes, solo era un documento con texto (misma fuente, tipo de letra, tamaño)
Ben Pearson
Espero que funcione para mí
Romantic Electron
20
Otra opción podría ser publicar la imagen en una aplicación web (posiblemente en un momento posterior), y hacer que se procese con OCR allí sin los problemas del puerto C ++ -> Java y posiblemente obstruir la CPU móvil.
Respuestas:
OCR puede consumir bastante CPU, es posible que desee reconsiderar hacerlo en un teléfono inteligente.
Aparte de eso, que yo sepa, las bibliotecas populares de OCR son Aspire y Tesseract . Ninguno de los dos es Java, por lo que no obtendrá una biblioteca de OCR de Android.
Sin embargo, Tesseract es de código abierto (GitHub alojado de hecho); para que pueda dedicar algo de tiempo a portar el subconjunto que necesita a Java. Tengo entendido que no es una locura C ++, por lo que, dependiendo de cuánto necesite OCR, podría valer la pena.
Tan breve respuesta: No.
Respuesta larga: si estás dispuesto a trabajar por ello.
fuente
Tengo mucha suerte con tesseract-android-tools
fuente
Otra opción podría ser publicar la imagen en una aplicación web (posiblemente en un momento posterior), y hacer que se procese con OCR allí sin los problemas del puerto C ++ -> Java y posiblemente obstruir la CPU móvil.
fuente
Google Goggles es la aplicación perfecta para hacer tanto OCR como traducción.
Y la buena noticia es que Google Goggles se convertirá en la plataforma de aplicaciones .
Hasta entonces, puedes usar motores IQ .
fuente
Sí hay.
Pero OCR es muy vasto. Conozco una aplicación de Android que tiene una función de OCR, pero puede que no sea el tipo de OCR que estás buscando.
Esta aplicación de código abierto se llama Aedict , y hace OCR en caracteres japoneses escritos a mano. No es tan lento.
Si no es lo que está buscando, especifique qué tipo de caracteres y qué entrada de datos (imagen o historial táctil XY).
fuente
Puede usar el lector de Google docs OCR .
fuente