¿Tiene sentido devolver un 410 en lugar de 404 cuando alguna página se ha eliminado de forma permanente?

16

¿Tiene sentido devolver un en 410lugar de 404cuando alguna página se ha eliminado permanentemente? En este video , Matt Cutts dice que Google los trata de la misma manera, pero ¿hay otras razones para implementar un 410(excepto por la corrección técnica)?

gran ciego
fuente
Me he preguntado sobre esto yo mismo. Parece que 410 ya no se usa en ningún lado.
wogsland

Respuestas:

7

En nuestro sitio web, hemos implementado recientemente 410 errores para páginas que se han eliminado permanentemente. Tenemos alrededor de 40 millones de páginas en el índice de Google y Googlebot nos rastrea con 2 millones de solicitudes por día.

Después de limpiar nuestra base de datos, encontramos una gran cantidad de errores 404 que seguían apareciendo en los Errores de rastreo en las Herramientas para webmasters. Cuando cambiamos a 410 estados en lugar de 404, el número de errores por día se redujo a la mitad, mientras que el número total de solicitudes realizadas se mantuvo casi igual. Así que al final eso es más páginas rastreadas con éxito por día. Parece que las páginas con un estado 404 se rastrean varias veces antes de eliminarse completamente del índice.

Entonces, diría que sí, definitivamente vale la pena usar 410 cuando sea apropiado para mantener su presupuesto de Google Crawl.

stefan verhoeff
fuente
11

Hay más que Google en este mundo. Un 410 le dice sin ambigüedad a un bot que el archivo se ha ido. Un 404 no lo hace. Un bot persistente podría seguir intentando encontrar un 404 indefinidamente, mientras que podría dejar de intentar encontrar un 410 de inmediato, lo que haría muy feliz a su servidor.

John Conde
fuente
2
Sin embargo, va en ambos sentidos: un bot realmente malo solo podría reconocer 200 y 404.
Peter Taylor
44
@Peter no está seguro de que eso importe: si son malos y no entienden los códigos HTTP, ¿qué daño causaría? Si usa 404, tanto los bots malos como los buenos seguirán solicitando la página, mientras que con 410 solo el malo.
DisgruntledGoat
1
Lo que dijo @DisgruntledGoat. Ver la Ley de Postel . Las implementaciones de mierda simplemente no se pueden explicar; ¿Qué vas a hacer, tratar de dar cuenta de todos ellos y de cada una de sus peculiaridades, todo al mismo tiempo? Hay raras excepciones, como por ejemplo el antiguo dominio del navegador de IE6, pero en general simplemente no vale la pena el esfuerzo.
Su '
6

Además de que existen más motores de búsqueda que Google, no hay razón para suponer que Google nunca cambiará la forma en que tratan las 410 respuestas. De hecho, parece que ya sucedió: la información que Matt Cutts cita en el video es de 2007, mientras que esta publicación de 2009 de John Mu en los foros de Webmaster Central de Google dice lo contrario:

"Seguí el asunto 404 vs 410 con el equipo aquí. Como lo mencionaron algunos otros aquí y en otros lugares, generalmente los hemos tratado de la misma manera en el pasado".

Sin embargo, después de ver cómo los usan los webmasters en la práctica, ahora estamos tratando el código de resultado HTTP 410 como un poco "más permanente" que un 404. Entonces, si está absolutamente seguro de que una página ya no existe y nunca volverá a existir, usar un 410 probablemente sería algo bueno ".

Por lo tanto, parece que Google ahora está tratando 410 respuestas de manera diferente de 404.

Ilmari Karonen
fuente
4

En mi experiencia, Google no entiende 410 códigos de error.

Hace algún tiempo, cambié un sitio completo, por lo que todas las URL antiguas son "410 Gone". No puedo usar redireccionamientos 301 porque no hay una relación directa con una nueva URL.

Solía .htaccessdecirle a Google que las URL antiguas desaparecieron, pero me sigue diciendo que hay una GRAN cantidad de errores 404 en mi sitio. Verifiqué las URL en el informe de error de rastreo y todas son 410, no 404 como dice.

usuario2623424
fuente
1

Hay más que Google en este mundo.

Citado por la verdad. Dado su requisito, para decirle a los bots (y presumiblemente también a los humanos) que una página ha sido eliminada permanentemente , en realidad optaría por un301 redirección a una página que explique (si es necesario) por qué se eliminó el contenido, o tome el bot / usuario volver a la página de índice.

Los códigos de error HTTP menos conocidos generalmente no son tan compatibles, entendidos o implementados en todos los ámbitos, por lo que generalmente me adhiero a los que están para garantizar la experiencia de navegación esperada y con suerte perfecta.

Elegir con qué opción ir depende de cuántas solicitudes todavía están llegando para el contenido (ahora) perdido.

stealthyninja
fuente
1
¿Por qué la necesidad de explicar la eliminación significa que necesita 301 a una URL diferente con esa explicación? La explicación podría estar en la página misma, con un estado 410 para que los motores de búsqueda entiendan que está muerta.
IMSoP