Google afirma ser justo, y a la compañía le interesa (la mayoría de las veces) buscar en Internet cualquier cosa y todo lo que sus arañas puedan acceder. Quiero saber:
- ¿Qué tipo de contenido (de acceso público) no entrega Google?
- ¿Existe un tipo específico de contenido que Google no puede recuperar?
Las referencias, especialmente a la propia documentación de Google, serían especialmente impresionantes.
google-search
samthebrand
fuente
fuente
Respuestas:
Algunas ideas sobre el tipo de cosas:
robots.txt
archivo de un dominio se excluye del índice de Google.Obtenga más información sobre la Web profunda
fuente
Aparte de Twitter, Google no indexa Tumblr tan bien. Las publicaciones de blog en Tumblr son más fáciles de encontrar usando la búsqueda de Tumblr. Además, todo en Google Sites no está (o apenas está) indexado. Si inicia un sitio de Google, obtenga su propio dominio.
Los blogs más pequeños que no se actualizan regularmente a menudo se eliminan de los resultados de búsqueda. Además de todo lo que piensan que es un splog .
fuente
Bueno, la mayoría del contenido de Twitter no está indexado por Google, incluso si es público. Solía estar disponible para Google, pero ese ya no es el caso ya que su acuerdo expiró.
Fuente .
fuente
Depende de en qué país te encuentres. En Alemania no muestra miles de sitios que el gobierno considera que no son buenos para usted, y la lista aumenta en miles cada año.
Google es el motor de la censura de Internet. Si desea un Internet gratis, use algunas compañías no malvadas, como DuckDuckGo u otras.
fuente
No puede buscar una palabra clave con caracteres especiales en la Búsqueda de Google :
Esto es especialmente molesto cuando Google tiene un código.
fuente
Google elimina los resultados de búsqueda que se considera que infringen los derechos de propiedad intelectual luego del retiro de DMCA y solicitudes similares. Consulte el formulario de solicitud de eliminación de resultados de búsqueda de Google (puede tener una URL adicional por cierto).
fuente
Sitios con tanto contenido que Google simplemente no ha tenido tiempo (o la inclinación) para indexarlo todo.
Los sitios que no tienen un mapa del sitio rastreable y requieren que Google proporcione términos de búsqueda para acceder a los resultados disponibles en el sitio podrían no estar completamente indexados.
fuente