Archivos que debería tener en cada sitio web

36

Me gustaría tener una lista de archivos que deberían existir en cada sitio web. La idea es complacer a la mayoría de los navegadores y bots y obtener la cantidad de mensajes 404 en los registros.

Hasta ahora tengo los siguientes archivos:

  • /favicon.ico
  • /robots.txt
  • /sitemap.xml
  • /apple-touch-icon-72x72-precomposed.png
  • /apple-touch-icon-72x72.png
  • /apple-touch-icon-precomposed.png
  • /apple-touch-icon.png

¿Hay otros archivos que se solicitan con frecuencia y deberían estar en cada sitio web?

Raffael Luthiger
fuente
2
¡Solo los odio! ¿Qué están pensando? Si les quería utilizarlo les habría añadido ...
PeeHaa
1
Te entiendo ... Pero lo que odio aún más son 404 mensajes en mi registro de apache.
Raffael Luthiger
2
para ser claro. Lo que odio es que los agentes de usuario intenten acceder a ellos de forma predeterminada.
PeeHaa
Sin embargo, esto plantea una pregunta diferente. Parece que su principal preocupación es reducir los registros 404 "extraños". ¿Está obteniendo muchos registros 404 legítimos que necesita clasificar? ¿O está tratando de ordenar el registro en busca de otros errores y los 404 se están interponiendo?
Chris
1
No tengo ningún problema con los navegadores que buscan íconos del sitio automáticamente, ya que eso ahorra a los webmasters la necesidad de incluir una referencia a ellos en cada página. Sin embargo, desearía que Apple se hubiera quedado con el estándar favicon, que admite canales alfa y múltiples tamaños de iconos.
Lèse majesté

Respuestas:

21

Hasta donde yo sé, no hay bots o aplicaciones que soliciten sitemap.xml sin que se les diga que debería estar allí. La mayoría de los sitios probablemente no lo tienen, y de los sitios que sí, muchos usan gzip, y muchos llaman al archivo de otra manera o colocan los mapas del sitio en una subcarpeta.

Aquí están todos los que conozco:

  • favicon.ico
    Le da a sus páginas un ícono en pestañas, marcadores, etc.
  • robots.txt
    Útil si necesita bloquear cualquier página de los motores de búsqueda, pero puede estar en blanco para permitir el acceso a todo. También puede contener la ubicación de su mapa del sitio.
  • Archivos de verificación de Herramientas para webmasters de Google
    El método más fácil de verificación (guarda tener metaetiquetas inútiles en su código HTML) Hay google[hash].htmly BingSiteAuth.xml. También tengo uno para Yahoo en mi raíz, pero probablemente ya no sea necesario.
  • crossdomain.xml
    Adobe Flash solicita este archivo cada vez que Flash necesita conectarse a su sitio. Probablemente nunca verá este archivo en sus registros en un sitio pequeño, pero tuve un montón de solicitudes en un sitio. Puede crear un archivo en blanco, ya que el valor predeterminado es bloquear el acceso a sitios externos.
  • .htaccess (Apache)
    Obviamente no solicitado por los navegadores / bots, pero vital para la mayoría de los sitios.

Finalmente, con respecto a los íconos que el iPhone insiste en solicitar: hay varios tamaños que pueden solicitarse. Mi iPhone 3G (iOS 5) solicita la versión 57x57 y veo 72x72 y 114x114 (la más común) en mis registros de errores. Entonces, si desea eliminar todos los 404 de sus registros, increíblemente, necesitará proporcionar todos estos:

  • /apple-touch-icon-57x57-precomposed.png
  • /apple-touch-icon-57x57.png
  • /apple-touch-icon-72x72-precomposed.png
  • /apple-touch-icon-72x72.png
  • /apple-touch-icon-114x114-precomposed.png
  • /apple-touch-icon-114x114.png
  • /apple-touch-icon-precomposed.png
  • /apple-touch-icon.png
Cabra descontento
fuente
1
.htaccesses específico de Apache e, incluso para aquellos que lo usan, es una mala elección de rendimiento si uno tiene acceso a las definiciones de VirtualHost.
danlefree
+1 para crossdomain.xml: eso no se me había ocurrido y es una gran idea incluirlo.
Jacob Hume
Una vez un bot solicitó el sitemap.xml aproximadamente una vez al día. Y nunca registré este archivo en alguna parte. Entonces este bot solo lo estaba adivinando.
Raffael Luthiger
@DisgruntledGoat: Gracias por la actualización. No sabía que esos otros tamaños también existen.
Raffael Luthiger
1
Silverlight también usa clientaccesspolicy.xml.
Lèse majesté
3

Creo que probablemente lo tienes.

Incluso el ícono de Apple Touch no es completamente necesario, ya que si elige no tenerlo (y no lo vincula), iOS solo usará una miniatura de la página (personalmente, sin embargo, los agrego).

Diría que realmente NECESITA favicon.ico y robots.txt , sitemap.xml también es opcional.

Codecraft
fuente
1
Esto no evitaría la solicitud y, por lo tanto, los errores 404 que Raffael está viendo en sus registros. Si te concentraras en qué archivos tienen el mayor impacto, diría que tienes razón.
Jacob Hume
2

Otro que he notado es browserconfig.xml, que es una bastardisation solicitada por IE. Basura sangrienta llenando los troncos.

Lenny
fuente
Gracias. ¿Sabes qué debería estar en este archivo?
Raffael Luthiger
1

Las versiones más recientes de Apple solicitan estos archivos (en este orden)

  • /apple-touch-icon-120x120-precomposed.png
  • /apple-touch-icon-120x120.png
  • /apple-touch-icon-precomposed.png
  • /apple-touch-icon.png
Mark van tilburg
fuente
Gracias. Esto ampliaría la lista de DisgruntledGoat.
Raffael Luthiger