Por lo que he leído, parece que tiene que usar Solr para tener los archivos adjuntos de PDF y Word indexados y devueltos en una búsqueda. Tengo a Solr trabajando con Drupal, pero creo que necesito que Tika trabaje en Solr para hacer la indexación de documentos. Hay muy poca documentación que pueda encontrar para Tika. ¿Alguien sabe dónde está una buena fuente para esto? ¿Existe una forma mejor / más fácil de buscar en documentos adjuntos de índice de Drupal?
9
Respuestas:
Para ayudarlo, tiene este agradable módulo Apache Solr Attachments . Si descarga el módulo, tendrá un archivo README.txt que le dará algunas pistas sobre cómo ayudarlo a instalar y configurar Tika.
fuente
Hemos usado Search Files antes con éxito, pero creo que la última vez que lo usamos fue hace dos años. Tenga en cuenta que existen requisitos del lado del servidor para que los ejecutables realicen la búsqueda, y que no hay una versión de Drupal 7 disponible.
fuente
Descubrí Search File Attachments , que tiene soporte para Drupal 7/8 y una variedad de tipos de archivos.
fuente