¿Cuál es el motor de búsqueda autohospedado ideal? [cerrado]

11

Tengo un sitio interno (intranet) que se compone de varios blogs y foros, cientos de páginas estáticas, muchos archivos PDF y varios otros tipos de documentos. Se ha pegado libremente en los últimos años y ahora es mi trabajo mantenerlo.

Estoy buscando un motor de búsqueda que pueda alojarme idealmente:

  1. Permite buscar directamente en las bases de datos del Blog / Foro si se le proporciona la información de la base de datos y las tablas para buscar.

  2. Maneja la mayoría de los documentos de texto (PDF / DOC / ODF)

  3. Es de código abierto, o permite el acceso al código fuente una vez comprado

No me importa en qué idioma o plataforma está escrito. Normalmente, solo usaría la búsqueda en el sitio de Google, pero esa no es una opción para una intranet.

Tim Post
fuente

Respuestas:

2

He usado Sphider antes y me ha impresionado bastante.

Darryl Hein
fuente
2

SearchBlox, que se basa en Lucene, puede satisfacer sus necesidades. Es gratis y viene con un rastreador.

wilkie mate
fuente
gratis por 25k urls, lo que no es mucho para una intranet
cweiske
@cweiske Echa un vistazo a Ambar, está basado en ElasticSearch y es gratis. github.com/RD17/ambar
Ilya P
0

Normalmente, solo usaría la búsqueda en el sitio de Google, pero esa no es una opción para una intranet.

De hecho, existe el dispositivo de búsqueda de Google, que es el equivalente de la búsqueda en el sitio de Google para intranets. Sin embargo, esto no es de código abierto (la búsqueda en el sitio de Google tampoco lo es, en caso de que no lo haya notado).


fuente
Lo miré Realmente quiero algo donde pueda tener acceso al código. También es un poco pesado en el departamento de presupuesto.
Tim Post
Además de Google Search Appliance, existe un producto similar de "Thunderstone" que es competitivo. He usado ambos en el pasado. Si bien es posible que no funcione para usted, pensé en publicar para otros que tropiezan con la pregunta.
digit1001