¿Alternativa de código abierto a "Google Appliance" para la búsqueda en la intranet? [cerrado]

15

¿Hay alguna solución alternativa de código abierto (con una consola web)?

Martin K.
fuente
1
Las recomendaciones de productos y servicios generalmente no se ajustan a la falla del servidor (consulte las preguntas frecuentes y esta publicación de blog ). Hay muchos dispositivos y software de motor de búsqueda disponibles: Google puede ayudarlo a encontrar algunos, y luego puede
adaptarlos

Respuestas:

3

Pruebe esto: http://www.flax.co.uk/

(No tengo experiencia con este producto u otros productos de búsqueda empresarial).

Estrella de mar
fuente
el enlace está roto ... solo use flax.co.uk
Russ
1
No ha salido mucho de ese proyecto recientemente. ¿Ves el lino vivo? discusión sobre el grupo de discusión sobre lino de julio de 2010 y la última publicación de septiembre de 2011 que no obtuvo respuesta.
Día
6

Solr, del proyecto Apache Lucene. Extracto del sitio web

http://lucene.apache.org/solr/

Solr es un servidor de búsqueda empresarial de código abierto basado en la biblioteca de búsqueda Java Lucene, con API XML / HTTP y JSON, resaltado de resultados, búsqueda facetada, almacenamiento en caché, replicación, una interfaz de administración web y muchas más funciones. Se ejecuta en un contenedor de servlet de Java como Tomcat.

Will Glass
fuente
SOLR parece muy genial. El problema es cómo rastrear / indexar páginas web sin Nutch. Trabajo con ASP.Net y no parece haber un rastreador de facto para SOLR que funcione de forma nativa con Windows.
dana
2

He usado 'htdig' en el pasado para la búsqueda en la intranet. Es bueno e indexa documentos pdf por defecto. Una vez que pueda agregar filtros que puedan traducir documentos a formato de texto para indexar, también comenzará a admitir otros formatos.

Saurabh Barjatiya
fuente
2

No es de código abierto, pero Microsoft Search 4.0 es gratuito en este enlace

Diría que vale la pena intentarlo, me gustó el formato de los resultados devueltos, pero el problema era que los resultados incluirían documentos a los que un usuario no podía acceder debido a la seguridad. Por lo tanto, no fue bueno para nosotros ya que los nombres de los documentos también pueden contener información restringida, como "Bob-Warning Letter.doc"

SpaceManSpiff
fuente
0

He encontrado una solución con Google Desktop Search (que se puede usar como un dispositivo web con un complemento): lea más ...

Martin K.
fuente
Suena como lo mismo que hará Microsoft Search Server, pero con más esfuerzo.
SpaceManSpiff
¡Más esfuerzo pero gratis!
Martin K.
Search Server Express de Microsoft es completamente gratuito y la única diferencia entre él y la edición Enterprise es que Express no tiene equilibrio de carga. Por cierto, la necesidad de enchufar DNKA de acuerdo con su enlace tiene un pequeño cargo por uso comercial. Es curioso cómo Google requiere que uses su hardware para sus búsquedas empresariales. Creo que Google podría limpiar en esta área si lanzaran un software de edición de servidor que podría instalarse en su propio servidor.
SpaceManSpiff el
¡La información de la página está desactualizada! DNKA ahora es gratuito para uso comercial. La solución es absolutamente gratuita. Cuando intento descargar la edición express, en todas partes se muestra "Demo" o "Test". ¿Por qué Google debería requerir usar su hardware? La solución que mencioné es gratuita y solo requiere un entorno Windows. Funciona también con Mozilla como cliente (por ejemplo, desde cajas Unix / Linux). He leído que el rendimiento de búsqueda de Google es significativamente mejor.
Martin K.
Pruebe este enlace: microsoft.com/enterprisesearch/en/us/… Probablemente estaba intentando descargar la empresa completa, que es una edición de prueba. Genial que tu DNKA sea gratis ahora. Así es este. Lo que estaba tratando de decir es que una empresa para realizar una búsqueda en la intranet de Google (sin que sea una combinación) requiere un dispositivo de Google. Sería genial si Google hiciera una búsqueda de intranet empresarial solo de software, que no fuera una combinación de sus herramientas de búsqueda de escritorio y de terceros. Más administradores preferirían eso, creo.
SpaceManSpiff