Descubrí que McAfee SiteAdvisor ha informado que mi sitio web "puede estar teniendo problemas de seguridad" .
Me importa poco lo que McAfee piense de mi sitio web (puedo asegurarlo yo mismo y si no, McAfee definitivamente no es la compañía a la que pediría ayuda, muchas gracias). Sin embargo, lo que me molesta es que aparentemente han rastreado mi sitio web sin mi permiso.
Para aclarar: casi no hay contenido en mi sitio web todavía, solo algunos marcadores de posición y algunos archivos para mi uso personal. No hay ToS.
Mi pregunta es: ¿McAffee tiene derecho a descargar contenido / rastrear mi sitio web? ¿Puedo prohibirles que lo hagan? Tengo la sensación de que debería haber algún tipo de principio de "Mi castillo, mis reglas", sin embargo, básicamente no sé nada sobre todas las cosas legales.
Actualización: Probablemente debería haber mencionado que mi proveedor de servidores me envía correos electrónicos sobre los hallazgos de SiteAdvisor de forma regular; así es como descubrí su 'calificación' y es por eso que estoy molesto.
fuente
Respuestas:
Hay un precedente legal para esto. Field v. Google Inc., 412 F. Supp. 2d 1106, (US Dist. Ct. Nevada 2006). Google ganó un juicio sumario basado en varios factores, en particular que el autor no utilizó un archivo robots.txt en las metaetiquetas de su sitio web, lo que habría evitado que Google rastreara y almacenara en caché las páginas que el propietario del sitio web no quería indexar.
PDF gobernante
No existe ninguna ley de EE. UU. Que se ocupe específicamente de los archivos robots.txt; Sin embargo, otro caso judicial ha sentado un precedente que podría conducir a que los archivos robots.txt se consideren como eludidores de las medidas electrónicas intencionales tomadas para proteger el contenido. En ABOGADOS DE SALUD, INC. Vs. HARDING, EARLEY, FOLLMER & FRAILEY, et. Todos, Healthcare Advocates argumentaron que Harding y otros esencialmente piratearon las capacidades de Wayback Machine para obtener acceso a los archivos en caché de páginas que tenían versiones más recientes con archivos robots.txt. Mientras que Healthcare Advocates perdió este caso, el Tribunal de Distrito señaló que el problema no era que Harding et al "abrieran el candado", sino que obtuvieron acceso a los archivos debido a un problema de carga del servidor con la máquina Wayback que otorgó acceso al archivos en caché cuando no debería
PDF de fallo judicial
Solo es cuestión de tiempo en mi humilde opinión hasta que alguien tome esta decisión y la ponga de su lado: el tribunal indicó que robots.txt es un candado para evitar que se arrastre y eluda que está cerrando el candado.
Desafortunadamente, muchas de estas demandas no son tan simples como "Traté de decirle a su rastreador que no está permitido y su rastreador ignoró esas configuraciones / comandos". Hay una serie de otros problemas en todos estos casos que, en última instancia, afectan el resultado más que el problema central de si un archivo robots.txt debe considerarse o no un método de protección electrónica según la ley DCMA de EE. UU.
Dicho esto, esta es una ley de los EE. UU. Y alguien de China puede hacer lo que quiera, no por el problema legal, sino porque China no hará cumplir la protección de marcas registradas y derechos de autor de los EE. UU., Así que buena suerte los persigue.
No es una respuesta corta, ¡pero realmente no hay una respuesta corta y simple a su pregunta!
fuente
Sí, tienen derecho a hacerlo: has creado un sitio web público, ¿qué te hace pensar que no?
Usted también, por supuesto, tiene derecho a detenerlos. Puede pedirles que no rastreen su sitio web con robots.txt o que eviten activamente que accedan a él con algo como fail2ban .
Alternativamente, no te preocupes por eso y continúa con tu vida. No está haciendo daño a nada y definitivamente está en el lado benigno de las pruebas de Internet.
fuente
Si este comportamiento es ético o no, no está perfectamente claro.
El acto de rastrear un sitio público no es, en sí mismo, poco ético (a menos que lo haya prohibido explícitamente utilizando un archivo robots.txt u otras medidas tecnológicas, y los están eludiendo).
Lo que están haciendo es el equivalente aproximado de llamarlo en frío, mientras anuncia al mundo que posiblemente no está seguro. Si eso daña tu reputación y no está justificado, no es ético; si lo hace y la única resolución para esto implica que usted les pague, es un crimen organizado. Pero, no creo que esto sea lo que está sucediendo.
La otra vez que esto no es ético es cuando alguien rastrea su sitio para apropiarse de su contenido o datos y luego lo representa como propio. Pero, eso tampoco es lo que está sucediendo.
Por lo tanto, sugiero que su comportamiento en este caso es ético, y es muy probable que también lo ignore.
Su comportamiento relacionado con el envío de spam no es ético si no tiene relación con ellos y no solicitó los correos electrónicos, pero sospecho que tienen una cancelación de suscripción que funciona.
fuente
Disallow
directiva en un archivo robots.txt una "medida tecnológica prohibida". robots.txt actúa como una solicitud de cortesía, y aunque los bots con buen comportamiento lo acatarán, no hay obligación ni seguridad real. De hecho, los bots mal portados podrían tomar una entrada en robots.txt como una invitación para rastrear esa ruta específica ...Enfoque técnico para bloquear el acceso de ciertas personas o empresas a su sitio web:
Puede bloquear direcciones IP específicas o rangos de direcciones para que no accedan a las páginas de su sitio. Esto está en el archivo .htaccess (si su sitio se ejecuta en el servidor web Apache).
http://www.htaccess-guide.com/deny-visitors-by-ip-address/
Haga que su servidor web registre las direcciones IP a las que se accede y busque esas direcciones IP para encontrar las asociadas con McAfee. Probablemente sea fácil saberlo ahora, si no tiene visitantes regulares.
Por supuesto, podrían cambiar las direcciones IP en el futuro. Aún así, si busca las direcciones IP que encuentra, para ver quién las posee, es posible que pueda aprender sobre un bloque completo de direcciones propiedad de McAfee y bloquearlas todas.
Para una base legal para hacerlo:
"Los propietarios de sitios web pueden bloquear legalmente a algunos usuarios, reglas judiciales"
http://www.computerworld.com/s/article/9241730/Website_owners_can_legally_block_some_users_court_rules
(Si su sitio web es personal, nadie cuestionaría su derecho a bloquear a algunos usuarios. Pero si es un sitio web para una empresa, existen argumentos legales y morales en ambos lados de esa discusión. Cuanto más pequeña sea su empresa, más fácil será debe estar protegido legalmente y, de todos modos, a nadie le importaría lo suficiente como para quejarse.
También te puede interesar "Denegar visitas por referencia".
http://www.htaccess-guide.com/deny-visitors-by-referrer/
fuente