¿Cómo puedo evitar el spam en los sitios que controlo?

27

Esta es una pregunta general de wiki comunitaria para abordar todas las preguntas de prevención de spam no específicas.

Si su pregunta se cerró como un duplicado de esta pregunta y considera que la información proporcionada aquí no proporciona una respuesta suficiente, abra una discusión sobre Pro Webmasters Meta .


A los fines de esta pregunta, el spam incluirá:

  • Cualquier publicación automatizada
  • Contenido publicado manualmente que incluye enlaces a sitios de spammers
  • Contenido publicado manualmente que incluye instrucciones para visitar el sitio de un spammer
danlefree
fuente

Respuestas:

27

La siguiente lista está organizada por la relativa facilidad de implementación, costo de mantenimiento y efectividad en la prevención de spam:

Deshabilitar todo el contenido generado por el usuario

Esta es una solución de tierra quemada que resta valor al crecimiento de una comunidad de usuarios alrededor de su sitio, sin embargo, también se garantiza que le ahorrará el tiempo y el esfuerzo de lidiar con el correo no deseado o la prevención del correo no deseado.

Además de deshabilitar el contenido generado por el usuario, no existe una solución garantizada para evitar que aparezca todo el spam (u otro contenido no deseado), sin embargo, una solución que disuade a la mayoría de los spammers debería ser suficiente si también brinda a los visitantes de su sitio la opción de marcar el contenido. como spam.

Externalizar la gestión de contenido generado por el usuario

Servicios como Disqus permiten a los webmasters externalizar la selección, el almacenamiento y la publicación de comentarios generados por los usuarios. (Nota: el uso de un servicio de terceros requiere una configuración adicional para garantizar que los motores de búsqueda indexen los comentarios)

CAPTCHA

Según Wikipedia , CAPTCHA significa "Prueba de Turing pública completamente automatizada para distinguir computadoras y seres humanos". Cualquier prueba automatizada diseñada para evitar que una computadora publique contenido es un CAPTCHA: esto incluye obligar a los usuarios a leer letras, números y palabras de imágenes, hacer simples rompecabezas o preguntas de matemáticas, o de otra manera "probar" que son personas.

La desventaja de CAPTCHA es que

  1. La mayoría de las formas de CAPTCHA proporcionan un nivel de molestia para los usuarios.

  2. No son 100% protectores. Tenga en cuenta que muchas de estas pruebas pueden ser completadas por computadoras si un programador competente decide invertir suficiente tiempo y esfuerzo en el problema

Preguntas y respuestas sobre CAPTCHA

El CAPTCHA más efectivo para sitios pequeños es la pregunta y respuesta CAPTCHA. Un Q&A CAPTCHA es una pregunta que un sitio web le pide al usuario que responda. La pregunta es algo que cualquiera que visite el sitio sabría, pero que un programa de computadora no sabría. Una pregunta de ejemplo para un sitio sobre SEO sería "¿Qué significa SEO". Esta pregunta sería fácil de responder para el lector promedio de ese sitio, pero cualquier programa de computadora no podría hacerlo.

NOTA: preguntas como "qué es 1 + 1" no funcionan bien, ya que a menudo se usan, y las personas que construyen robots de spam los programan para responder correctamente a esas preguntas.

Sin embargo, si su sitio recibe mucho tráfico, los spammers programarán sus robots para responder esas preguntas automáticamente, y el Q & a CAPTCHA ya no será efectivo.

Campo escondido

Si tiene un formulario y no desea que los spammers puedan usarlo, una buena forma de detenerlos es utilizando un campo oculto. Estos son muy simples de configurar: agregue un campo redundante a su formulario, escóndelo a través de CSS (o JavaScript) y detenga todo lo que intente ingresar un valor en ese campo. Los usuarios normales no podrán ver el campo y lo ignorarán porque está oculto para ellos, pero los programas informáticos empleados por los spammers intentarán ingresar un valor en ese campo porque no procesan CSS ni JavaScript. Para vencer a los robots de spam que cargan CSS o Javascript, puede agregar un campo adicional a los formularios con una solicitud para dejarlo vacío. Cualquier visitante humano lo dejará vacío y puede bloquear fácilmente los bots que agregan datos al campo. No olvide el hecho de que esto puede hacer que el sitio se vea poco profesional.

Análisis de tráfico y contenido

Los spammers tienen un número limitado de redes y máquinas para publicar (que normalmente usarán hasta que ya no funcionen). Las soluciones de análisis de tráfico recopilan datos de una gran cantidad de hosts para determinar si una publicación contiene contenido de spam conocido o si proviene de un host o red de spammer conocido.

Existe una variedad de soluciones de análisis de tráfico y CAPTCHA de terceros que son de uso gratuito (o barato) y la mayoría del software de gestión de contenido de código abierto incluye módulos integrados para el uso de servicios como Akismet y reCAPTCHA .

Bloquee palabras comúnmente contenidas en spam

Si observa que el correo no deseado en su sitio web comúnmente contiene palabras que los usuarios legítimos no usan (o no usan) (como "enlaces gratuitos a su sitio"), entonces bloquear a los usuarios para que no publiquen esas palabras es una solución afectiva. Si le preocupa que los usuarios que tienen un uso legítimo de esas palabras en sus publicaciones tengan problemas para publicar en su sitio, puede configurar el filtro para que ignore las publicaciones de usuarios establecidos.

rel="nofollow"

Los spammers tienden a centrarse en sitios que les permiten publicar enlaces que seguirán los motores de búsqueda (mejorando así el rango de búsqueda del sitio que anuncian).

Puede hacer que su sitio sea menos atractivo para los spammers agregando rel="nofollow"a los enlaces incluidos en el contenido generado por el usuario, sin embargo, este enfoque puede no funcionar, ya que la mayoría del spam está automatizado y los spammers no tienen forma de saber si un sitio usa o no rel="nofollow"enlaces.

Moderación por los usuarios

Cualquier persona puede publicar contenido, sin embargo, una vez que el contenido se muestra en el sitio, también se puede marcar como spam y eliminar (esta opción solo funciona en la práctica si los visitantes perciben que el contenido de spam es relativamente poco común: si se permite que el spam supere comentarios útiles , la mayoría de los visitantes no se molestarán en marcar spam).

Gamificación

La gamificación es una excelente manera de motivar a los usuarios a denunciar el spam. Considere agregar una función de "peso de la bandera" a su sitio: cuantos más usuarios de spam reporten, más puntos obtendrán. Esto hará que la búsqueda de spam sea más divertida y les dará a las personas que denuncian derechos de fanfarronear. Eso, a su vez, alentará a los usuarios a reportar spam.

Moderación por parte de los administradores

Un ser humano debe revisar cada elemento de contenido publicado antes de que se publique en el sitio; aunque esto no evita que se publique spam, sí evita que se muestre spam a los visitantes del sitio (reduciendo así el valor del sitio para los spammers humanos) .

registro de usuario

El registro de usuarios es una mejora con respecto a CAPTCHA porque los usuarios solo se ven obligados a demostrar que son humanos una vez antes de que se les permita comentar a su conveniencia; esto técnicamente no es una forma diferente de prevención de spam, aunque sí elimina el spam creado por un usuario específico o grupo de usuarios (como se identifica por nombre de usuario, correo electrónico, dirección IP u otro factor de identificación) más fácil de aplicar.

Usuarios nuevos moderados

En lugar de aprobar cada publicación, un administrador puede revisar los registros de nuevos usuarios para determinar si aprueba o no un usuario en función de si el registro del usuario es coherente con los spammers identificados o los robots de spam automatizados.

Limitar nuevas capacidades de usuario

Los spammers humanos rara vez recordarán regresar a las cuentas que han creado si no pueden publicar spam libremente en una cuenta; requieren que los nuevos usuarios creen un número determinado de publicaciones (si la comunidad tiene la capacidad de marcar el spam) y / o esperar un conjunto cantidad de tiempo antes de que se levanten las restricciones sobre la publicación de enlaces o publicaciones múltiples.

Cobrar Usuarios por Membresía

Si cobra por la membresía, incluso si la tarifa es pequeña, los spammers se verán obligados a sopesar el costo de la membresía con el valor de publicar spam en su sitio (y pasar su sitio a favor de objetivos más fáciles).

Sólo invitados

Si solo permite que las personas que han sido invitadas por otros usuarios se registren, esto reducirá el spam (los humanos generalmente no invitan a los robots).

Lo siguiente es del Proyecto BOTCHA , Drupal.

Tarro de miel

Implementación de honeypot-trap . La esencia de esto es que el campo se agrega al formulario con un cierto valor, que luego es modificado por JS. El spam es cualquier envío de formulario, cuyo valor calculado no es el mismo que necesitamos.

HoneyPot2

Lo mismo que arriba, pero usando como fuente de cálculo no el valor de un campo en particular, sino los datos de CSS.

ObscureUrl

Similar a HoneyPot2: construido por JS se compara con la necesidad. La diferencia es que el valor inicial se pasa a través del parámetro GET.

Conclusión

La mayoría de los webmasters encontrarán que una combinación de las soluciones enumeradas anteriormente (con la excepción de no permitir el contenido generado por el usuario) funciona mejor para su sitio y al menos una solución debe implementarse para evitar que el spam automatizado ahogue las discusiones de los visitantes.

danlefree
fuente
1
+1 a través de la respuesta! Agregaría que puede implementar algún tipo de sistema de recompensa para los usuarios que reportan spam como parte del método "Moderado por los usuarios". En la aplicación que estoy creando ahora, los usuarios que reporten con éxito los spammers obtendrán "puntos asesinos de spam" que son como los derechos de fanfarronear que aparecen en sus perfiles. Además, pueden gastar estos puntos como moneda en el sitio para lograr mejores resultados de listado en las búsquedas de perfil. Por supuesto, esto abre la posibilidad de abuso, por lo que tengo que encontrar alguna forma de combatir esa forma de spam en caso de que surja.
JakeRow123
@ JakeRow123 Agregué una sección sobre gamificación: siéntase libre de editarla y agregar sus pensamientos.
5

Recientemente eliminamos el spam de nuestro formulario de contacto con una implementación muy simple. Agregamos una entrada que fue etiquetada como "URL:" en el formulario HTML y la hizo invisible para los usuarios reales. Luego, en el procesador de formularios, verificamos si tiene un valor y actuamos en consecuencia.

Los spambots muerden el anzuelo todo el tiempo; ponen una URL a algún sitio con spam. Nuestro guión lo ve y tira el comentario (en realidad, reciclamos los bits porque estamos tratando de ser una empresa más ecológica y ecológica). Por un tiempo, aún almacenaríamos el comentario ofensivo en una tabla de base de datos para su revisión, pero nos negaríamos a enviar los resultados por correo electrónico a cualquier parte. Así es como sabemos que funcionó.

Con este método simple pasamos de más de 30 mensajes de "Contáctenos" por día a CERO.

¡Buena suerte con lo que elijas!

WebDevKev
fuente
En la entrada <form>, incluimos: <p class = "antispam"> Deje este campo vacío: <input name = "url" width = "200" /> </p> en el script de procesamiento, tenemos: if (isset ($ _ SESSION ['url']) && $ _SESSION ['url'] == '') {mail ($ to, $ subject, $ body, $ headers); }
WebDevKev
1

Tengo un foro, donde temporalmente habilité publicaciones anónimas. No quería usar Captcha, ya que a menudo tengo dificultades para leerlos, lo que puede evitar que la gente haga comentarios. Para ayudar a prevenir el spam utilicé Akismet para captar mensajes entrantes. Akismet no es a prueba de balas, pero me hizo la vida mucho más fácil.

Sin embargo, debe tener en cuenta los falsos positivos. Entonces, lo que hice fue crear un "Atributo de spam" en mi objeto de publicación y establecerlo en el valor de retorno de Akismet. Si una publicación se marcara como correo no deseado, me enviaría un correo electrónico y, a partir de entonces, podría decidir si era correo no deseado o no.

Dofs
fuente
3
Este es un cajón de sastre pregunta wiki de la comunidad y la respuesta - el foco principal de información general sobre la prevención de spam para su uso en el cierre de las preguntas a cabo por duplicado. Si lo desea, puede combinar sus recomendaciones con la lista.
danlefree
1 Akismet parece hacer un trabajo bastante bueno, dosnt llegar a todos ellos y somtimes bloques comentarios de fiar pero el 99% de las veces su derecho
sam
0

Por favor visite MediaWiki.
Buscar extensión: moderación
Esta extensión lo ayudará a prevenir el spam en los sitios que usted controla.
He usado esta extensión de MediaWiki muchas veces.
Y evita que los bots creen artículos de spam.

jehovahsays
fuente