Recuerdo un sitio cerrado debido al mal uso y me pregunto si los bots tienen una parte de él. Si el bot está PUBLICANDO algo en mi sitio, ¿de qué maneras puedo combatirlo? Estaba pensando en configurar algunas cookies y cambiar las cookies a través de JavaScript + marca de tiempo y firmar (por lo que las cookies de ayer no se pueden usar hoy y la próxima semana).
Estoy seguro de que la mayoría de las personas / bots simplemente usarían otro sitio en lugar de habilitar JavaScript en su bot.
¿Que más puedo hacer? Estoy pensando en el límite diario de POST y en un honeypot para bots genéricos que solo publican spam al azar.
fuente
John Conde describe muchos buenos enfoques. El problema al elegir una técnica anti-bot / anti-spam es equilibrar la efectividad y la conveniencia. Sería realmente incómodo tener que completar un CAPTCHA cada vez que desee publicar un comentario o mensaje, pero si solo requiere un CAPTCHA al registrarse, a veces eso no disuade a los spammers.
Algunas de las técnicas pasivas son una buena alternativa, ya que no requieren ninguna acción humana. El problema es que los bots se están volviendo cada vez más sofisticados, y si los bots pueden resolver CAPTCHA, entonces ciertamente pueden procesar JS y CSS. Por lo tanto, deberá ejercer un poco de ingenio, como usar CSS menos obvio para ocultar sus campos de trampa de bot.
Pero en función de su pregunta, creo que probablemente se dé cuenta de que el objetivo no es crear un sitio a prueba de bots, sino simplemente crear un elemento de disuasión suficiente para que los usuarios de bot simplemente elijan otros objetivos más fáciles. Entonces, lo que se requiere aquí variará de un sitio a otro, y probablemente requerirá algunas pruebas de prueba y error. Primero probaría las técnicas menos molestas.
Por último, otra forma de eliminar el correo no deseado de su sitio es utilizar la moderación entre pares para eliminar cualquier comentario enviado por bot o spam enviado manualmente que se deslice.
fuente
Como John Conde mencionó en su # 1) y usted mencionó, honeypot puede funcionar muy bien para la mayoría de los casos y la mayoría de los sitios web. Si alguna vez lo hace un bot, puede hacer uno de los otros métodos que John también mencionó. Pero, sinceramente, si su sitio tiene un tráfico bajo o promedio, esto debería ser el truco.
Ejemplo, uno de mis favoritos:
Ahora, cuando se envía el formulario, un porcentaje extremadamente alto de bots completará "email" y "email_address", pero los humanos solo completarán el que ven, "email" y no "email_address". Entonces, en su código `/ process-form 'solo tiene que verificar si email_address (no) está vacío para la verificación.
Simple y efectivo.
fuente