Estoy construyendo un sitio de Wordpress para un padre de un niño de 11 años que quería algo para conmemorar los logros deportivos, académicos y personales de sus hijas. El sitio incluye fotos y videos de ella y sus amigos, información biográfica y publicaciones de blog. El dominio está registrado de forma privada a nombre de mi empresa, no los agrego a la consola de Google y mantengo otros SEO minimizados. No hay apellidos ni direcciones físicas. Quiero tener en mente la mayor seguridad posible para evitar que los raspadores capturen sus fotos, etc., miradas indiscretas, etc. Probablemente estoy siendo paranoico y, como todos mis sitios, piensan que podría obtener más tráfico del que realmente tiene, pero me imagino que es Vale la pena la investigación y vale la pena salpicar mis i's. El sitio web del niño es de excelente gusto y el padre es muy sensato,
¿Hay algún método confiable que pueda tomar para aumentar la seguridad en la Web para esta niña de 11 años y su sitio?
fuente
robots.txt
archivo con el contenido correcto puede mantener a todos los bots legítimos. La parte difícil es el resto. Muchos de ellos pueden mantenerse alejados si la dirección del sitio es difícil de encontrar.Respuestas:
Tal vez estoy siendo paranoico, pero parece que debería ser un blog / sitio web completamente privado. es decir. contraseña protegida. ¿Quién es exactamente el público objetivo?
Además del aspecto de seguridad (evitar que los inescrupulosos encuentren y usen el contenido), este tipo de contenido parece estar listo para la intimidación de otros "amigos" de la escuela. El contenido que podría estar bien al principio, para un niño de 11 años, podría volverse vergonzoso en unos pocos años.
Esto parece ser al revés? La forma de ocultar contenido de Google (es decir, un bot "bueno") es usar la
robots
metaetiqueta (oX-Robots-Tag
encabezado) y tal vezrobots.txt
. Omitirlo desde Google Search Console no ayudará a este respecto.Al menos si lo agrega a Google Search Console, puede monitorear cosas como vínculos de retroceso, verificar robots.txt, etc. Si de hecho lo hace público.
fuente
La única respuesta apropiada es proteger con contraseña todo el asunto. HTTP BASIC_AUTH es probablemente el más sencillo de configurar, ya que no interactuará con WordPress de ninguna manera. Eso por sí solo será suficiente para disuadir a todos los raspadores, pero si desea una seguridad adecuada, también debe usar HTTPS.
(Nota al margen: con muchos sistemas, una página HTTP redirigirá a HTTPS. Sin embargo, con HTTP BASIC_AUTH, esa redirección puede ser posterior a la solicitud de su contraseña. La página HTTPS solicitará la contraseña nuevamente. Esto significa que su contraseña ha sido ingresada dos veces, una vez en texto sin formato y una vez a través de un canal seguro. En principio es posible tener diferentes contraseñas para las versiones HTTP y HTTPS, o no tener una contraseña para la versión HTTP: todo lo que hace es redirigir a la versión HTTPS, que luego le solicita su contraseña. La facilidad de configuración depende de las herramientas que esté utilizando para administrar las preferencias de alojamiento de su sitio web. Alternativamente, simplemente asegúrese de navegar siempre directamentea la página HTTPS, sin pasar por la versión insegura. Si usa un sistema de contraseña que no sea HTTP BASIC_AUTH, entonces probablemente ninguna de estas notas al margen se aplicará).
fuente
Options -Indexes
).Primero, pediré una gran disculpa a todos los webmasters profesionales, pero para este OP, tengo una sugerencia de oro:
Violar las pautas del motor de búsqueda
Y me refiero a hacerlo hasta el punto en que el contenido importante esté en JavaScript complejo y los robots de contenido que puedan rastrear no estén en HTML adecuado. Esto incluye una etiqueta de descripción incorrecta, una etiqueta de título incorrecta, etc. Diablos, tal vez convierta todo el contenido en un video hecho en flash o muestre todo el contenido como una sola imagen. Eso realmente haría temblar al rastreador del motor de búsqueda.
Lo mostraré con un ejemplo en el código:
Aquí hay una manera de indexar algo:
Ok, lo admito, el texto no es perfecto, pero entiendes lo que quiero decir.
Ahora, si desea ocultarlo de los rastreadores y hacerlo de la manera más simple, puede intentar esto:
luego haga una imagen llamada mywebsite.jpg e incluya todo el texto en ella, no en el html que se muestra arriba. Entonces debe proteger mywebsite.jpg haciendo una versión con marca de agua para los usuarios que no están autorizados para ver la realidad. Simplemente compare las cadenas de agente de usuario o las direcciones IP con las que permite / rechaza para la imagen. Este tipo de cosas se pueden hacer en .htaccess con algunas reglas de reescritura.
Por ejemplo, para obligar a googlebot a ver la imagen con marca de agua en lugar de la imagen real, use estas reglas:
Supongo que mywebsite.jpg es su sitio web real como una imagen y specialrobotimage.jpg es la marca de agua o la imagen como un mensaje que indica que solo los usuarios reales pueden ver la información. Además, las reglas asumen que todo está en la misma carpeta.
fuente
Primero, esta es realmente una pregunta de WP. He escrito más de 20 sitios que hacen lo que necesita, así que esto es bastante fácil.
1 Hace que todos inicien sesión para ver cada página.
2 Bloquea la carpeta de cargas mediante script y .htaccess. Hay scripts que verificarán el inicio de sesión del usuario antes de permitirles ver medios.
Si desea hacer algo entre esto y tener su sitio abierto de par en par, es mucho trabajo. La forma más fácil de hacerlo es tener dos carpetas de carga: una con seguridad y otra para todo lo demás si desea tener algunas páginas abiertas al público y otras no.
En cuanto a lo que otros dicen sobre el contenido, no puedo encontrarlo si sus páginas están bloqueadas ... eso no es realmente cierto. Tengo scripts de robot que buscarán en la basura de una carpeta los nombres de los archivos.
Toda la charla de google y robots no tiene sentido. Eso solo importa si lo quieres a medias. Si lo hace, entonces tome el consejo de algunas de las preguntas arriba mencionadas.
fuente