¿Es una mala idea usar la Búsqueda de Google en su sitio web?

11

Si tiene una aplicación web con muchos registros, ¿es una mala idea usar la Búsqueda de Google en su sitio web? En lugar de escribir una función de búsqueda y tratar con un problema de rendimiento, 'externaliza' la función de búsqueda a Google.

John Doe
fuente
1
Esto me lleva a mi curiosidad, ¿podría proporcionar más detalles a la pregunta? porque crees que esto podría ser una mala idea? ¿Tienes más documentación que te hará pensar que es una mala idea? ¿Leíste algo que te hizo pensar que entendiste esto?
RTOSkit
Hola @RTOSkit, he desarrollado algunas aplicaciones web pequeñas y la funcionalidad de búsqueda sigue siendo uno de los mayores desafíos. Tengo que tener en cuenta la precisión del resultado de la búsqueda, así como el rendimiento del servidor. Personalmente, no creo que sea una mala idea, sino algo "incómoda", ya que es la única parte de la aplicación que no ha desarrollado.
John Doe
Ok, entiendo, @ JCL1178 le ofreció una respuesta óptima.
RTOSkit

Respuestas:

3

Como JCL1178 mencionó en su respuesta, Google solo devolverá resultados de lo que ha indexado. Esto no solo significa que es posible que algunos de sus resultados nunca aparezcan, sino que si su sitio alguna vez se desindexa por alguna razón, ha perdido la búsqueda de su sitio web. Tener algo tan importante como la búsqueda depende de un servicio de terceros no compatible es peligroso.

Dado que tiene acceso directo a los datos, puede proporcionar una búsqueda mucho mejor y más detallada que Google o cualquier otro motor de búsqueda. Puede permitir que sus usuarios busquen campos específicos, filtrando cualquier otro resultado de campos no relacionados. Google no tiene ningún contexto con los valores que está buscando, por lo que una búsqueda de la familia "Smith" podría mostrar resultados para las personas que viven en "Smith St." o alguien con la ocupación de "herrero".

La mayoría de las bases de datos relacionales populares vienen con la capacidad de realizar búsquedas de texto completo, por lo que agregar una función de búsqueda básica podría ser tan simple como escribir algunas declaraciones SQL.

Uso los motores de búsqueda personalizados de Google para la búsqueda general en mis sitios web, pero no lo usaría para buscar información almacenada en una base de datos, a menos que mi capacidad para realizar búsquedas de texto completo fuera limitada (limitaciones de software, problemas de rendimiento debido al hardware / tamaño del conjunto de datos). Depende de cuán complejos sean sus datos y cuán importante sea la búsqueda en la navegación de sus datos ... pero proporcionar sus propias instalaciones de búsqueda me parece la apuesta más segura.

Jacob Hume
fuente
Todos muy buenos puntos y omití totalmente la posibilidad de desindexar en mi respuesta.
JCL1178
Hola @Jacob Hume. Gran punto allí sobre confiar en el servicio de terceros. Eso era lo que tenía en mi mente también. He experimentado con búsquedas de texto completo y también con varios motores de búsqueda, pero como mencioné en uno de mis comentarios, siempre tengo problemas con la precisión de los resultados y / o el rendimiento del servidor. Nuevamente, muchas gracias por su aporte.
John Doe
3
Entonces, en lugar de tener un 0.00001% de posibilidades de que la búsqueda disminuya (es probable que Google no desindexe su sitio a menos que haga algo realmente estúpido), está proponiendo que el sitio tenga una ingenua implementación de búsqueda de texto completo 100% del tiempo? No es una buena compensación OMI. La búsqueda de texto completo es una función muy útil para acceder rápidamente a la funcionalidad de búsqueda básica, pero crear una función de búsqueda útil, mucho menos fácil de usar que la de Google, es un poco más complicado que simplemente "escribir algunas declaraciones SQL".
Lèse majesté
2
Los motores de búsqueda reales como Google, Solr, Lucene, Sphinx, etc., pueden hacer cosas como sopesar la proximidad de palabras clave, búsquedas de subcadenas, distancia levenshtein / metafonía / búsqueda de texto / búsqueda de texto difuso, etc. que mejoran enormemente la usabilidad. La búsqueda de texto completo es un buen punto de partida, pero en realidad se necesita mucho más trabajo para crear una función de búsqueda decente que pueda arrojar resultados relevantes de manera consistente. La mayoría de los desarrolladores que no son expertos en el desarrollo de motores de búsqueda harían bien en usar un servicio de terceros o al menos una solución comercial probada como Lucene o Solr.
Lèse majesté
2
Incluso las grandes empresas como Oracle luchan para crear búsquedas útiles en todo el sitio internamente (compare la búsqueda de documentación de MySQL.com antes y después de la adquisición de Oracle). Además, su caracterización del motor de búsqueda de Google es más apropiada para la búsqueda de texto completo local que el motor de búsqueda de Google, que en realidad utiliza los algoritmos de predicción de intención de usuario y heurística más avanzados de la industria.
Lèse majesté
7

A los fines de esta respuesta, supongo que está hablando de Google Custom Search / Site Search y no de Google Search Appliance, lo que sería una MUY buena idea, aunque costosa.

Subcontratar su búsqueda a Búsqueda personalizada de Google no es una mala idea, pero puede no ser la mejor opción para su sitio / modelo de negocio / lo que sea debido a las limitaciones y reglas de Google.

La búsqueda personalizada es esencialmente lo mismo que escribir search terms site: yoursite.comen Google, excepto que no tiene que especificar la site: yoursite.comparte y puede insertar un formulario de búsqueda en su sitio. Site Search es una versión no gratuita de Custom Search con más opciones de personalización y cierto acceso a la API. Hay algunas otras diferencias entre la Búsqueda personalizada / del sitio y el uso de Google propiamente dicho que se explican en la documentación vinculada, pero lo importante a tener en cuenta es que solo funcionan con lo que Google puede ver.

Por lo tanto, "la gran cantidad de registros" en su aplicación web tiene que ser capaz de ser analizada por Google para que la Búsqueda personalizada realmente arroje resultados precisos. Si limita / protege los registros de la visualización pública por cualquier motivo, debe mostrarle a Google los mismos resultados limitados que vería un usuario desconectado o puede hacer que Google indexe el contenido completo, pero debe cumplir con las reglas de First Click Free o arriesgarse a ser comido por un Panda enojado. Si presenta una cosa a Google y otra a los visitantes, eso es Encubrimiento y generará una penalización para su sitio. Si todos los registros que desea incluir en los resultados de búsqueda no se pueden dividir por cualquier motivo, entonces usar la Búsqueda personalizada de Google o la Búsqueda del sitio no es una buena idea para su modelo en particular.

Pero si puede permitir que todo se indexe, no le importa cómo Google devuelve los resultados de búsqueda de Búsqueda personalizada (o no está dispuesto a pagar por Site Search para solucionarlo), y está dispuesto a arriesgarse a que una página crítica no se indexe por cualquier razón, entonces puedes y debes considerarlo seriamente.

JCL1178
fuente
1

Te sugiero que uses la Búsqueda de Google, si quieres que todos los datos de tu sitio también sean vistos por otros. Ahorrará el bit extra de codificación.

Si se trata de un sistema cerrado y no desea que otros vean los datos, obtenga su propio sistema de búsqueda.

Sidh
fuente