Mi madre está tomando un curso en línea para ser una especie de bibliotecaria, en este curso cubren búsquedas booleanas, por lo que pueden buscar bases de datos de manera eficiente, sin embargo, recibió una pregunta que suena así:
La búsqueda "x OR y" dará como resultado 105 000 resultados, mientras que la búsqueda de solo x dará como resultado 80 000 resultados y una búsqueda de solo y obtendrá 35 000 resultados. ¿Por qué la búsqueda "x OR y" da 105 000 resultados, cuando las búsquedas individuales combinadas dan 115 000 resultados?
Para mí esto sonaba extraño, así que lo probé yo mismo, usando las palabras tocino y sandwich .
- Solo el tocino arrojó 179 000 000 resultados
- Solo el sándwich arrojó 312 000 000 resultados
- tocino O sandwich dio 491 000 000 resultados
Pero para mí suma: 179 000 000 (tocino) + 312 000 000 (sándwich) = 491 000 000 (tocino O sándwich)
¿Por qué una consulta OR podría dar como resultado menos visitas que ambas consultas individuales combinadas?
Respuestas:
Sugerencia: la búsqueda xYy dará como resultado 10 000 visitas.
fuente
El principio de conteo que se aplica aquí es la inclusión-exclusión .
Para que los números funcionen, debe ser 10000.El | X∩ YEl |
Un diagrama de Venn puede ser más convincente para alguien que pueda sentirse intimidado por la notación.
fuente
Documento 1: El gato está sobre la mesa
Documento 2: Mi gato es negro
Documento 3: El perro está debajo de la mesa
Documento 4: ¿Cómo se llama su gato?
Documento 5: esta es una foto en blanco y negro
Búsqueda de gato : los documentos devueltos son 1,2,4 (3 documentos devueltos)
Búsqueda de negro : los documentos devueltos son ...
Búsqueda de gato O negro : los documentos devueltos son ...
:-D :-D
fuente
En palabras simples:
Buscar X te da n respuestas.
Buscar Y te da m respuestas.
Buscar X e Y te da p respuestas.
Al buscar X O Y, la búsqueda se interrumpe tan pronto como encuentra X o Y. Entonces, si hay una X antes de una Y, esa Y no se contará en la búsqueda de X O Y. Por lo tanto, su búsqueda de X O Y le dará n + m - p respuestas.
Es importante tener en cuenta que los resultados serán los mismos, ya sea que realice 2 búsquedas o solo una. Es solo que al sumar las dos búsquedas, algunos documentos se cuentan dos veces.
fuente
Imagina que solo tienes un documento. Este es el Documento # 1 con esto:
Ahora imagine que tiene una función de búsqueda que puede proporcionarle todos los documentos basados en una palabra clave:
Tenga en cuenta que el número de documentos en ambos casos es 1. Ahora, si tiene una función de búsqueda que le proporciona el número de documentos que coinciden con una o más de las palabras clave proporcionadas:
Cuando agrega el número de documentos que contienen
X
al número de documentos que contienenY
, esto hace que cuente el mismo documento dos veces. En su caso, esto sucedió10000
veces como se señaló anteriormente :)fuente