¿Qué es un archivo robots.txt mínimo válido?

14

No me gusta, veo muchos errores 404 en el archivo access.log de mi servidor web. Recibo esos errores porque los rastreadores intentan abrir un archivo robots.txt , pero no pueden encontrar ninguno. Por lo tanto, quiero colocar un archivo robots.txt simple que evitará que aparezcan los errores 404 en mi archivo de registro.

¿Qué es un archivo robots.txt válido mínimo que permita rastrear todo en el sitio?

bessarabov
fuente

Respuestas:

17

Como se indica aquí , cree un archivo de texto llamado robots.txt en el directorio de nivel superior de su servidor web. Puede dejarlo vacío o agregar:

User-agent: *
Disallow:

Si quieres que los robots rastreen todo . Si no, entonces vea el enlace de arriba para más ejemplos.

dan
fuente
¿Por qué agregar "Disallow:" y no solo "Permitir: *"?
Athoxx
2
@Patrik "Permitir" es para anular cualquier directiva anterior "No permitir". No tiene sentido si no hay "No permitir". Sinceramente, la mejor solución es un archivo en blanco.
DisgruntledGoat
2
Ah, ya veo. También estoy de acuerdo en que un archivo en blanco es lo mejor.
Athoxx
2
@PatrikAlienus Porque "Permitir" no está en la especificación de robots.txt.
user11153
1
@ usuario11153: ¿Eh? ¿Qué pasa con la sección "3.2.2 Las líneas Permitir y No permitir" de la especificación del Borrador de Internet de 1997 Método A para el Control de Robots Web ?
David Cary
2

El mejor mínimo robots.txtes un archivo completamente vacío.

Cualquier otra directiva "nula", como una vacía Disallowo Allow: *no solo es inútil porque no funciona, sino que agrega complejidad innecesaria.

Si no desea que el archivo esté completamente vacío, o si desea que sea más legible para los humanos, simplemente agregue un comentario que comience con el #carácter, como # blank file allows all. Los rastreadores ignoran las líneas que comienzan con #.

Maximillian Laumeister
fuente
0

Yo diría esto;

User-agent: *
Disallow: /wp-admin/
Allow: /wp-admin/admin-ajax.php

Permitirá a Google rastrear todo, pero no permitirá que Google rastree su panel de administración. Cuál es una situación ideal para ti.

Fahad Ur Rehman Khan
fuente
2
Puede que me falte algo, pero no creo que el autor de la pregunta haya dicho que están usando Wordpress.
Maximillian Laumeister