¿Cómo luchar contra los spammers de referencia de Google Analytics?

43

Los últimos meses tengo muchos spammers de referencia en mis estadísticas de GA. Su conteo es ~ 10 veces mayor que el conteo de visitantes legítimos (mi sitio aún no es muy popular). He activado una opción para ocultar spammers conocidos en la configuración de GA, pero no ayudó en absoluto. Parece que estos spammers están utilizando scripts para enviar spam directamente a GA (es decir, no están registrados en mi IIS).

¿Hay algo que pueda hacer para detener a estos spammers?

UPD 10 meses después, y comenzaron a enviar spam usando nombres de página de destino falsos ... y Google todavía no está haciendo nada al respecto.

usuario626528
fuente
1
Por favor, compruebe si hay archivos de registro de visitas con spam de referencia y avísenos si ve alguno. Si puede, edite la pregunta e incluya el spam de referencia en cuestión. Sospecho que ya sé la respuesta. Estoy investigando un poco y últimamente hay una buena cantidad de actividades de referencia, algunas de las cuales he experimentado yo mismo. Además, si tiene instalado WordPress, asegúrese de que esté actualizado. Parece que uno de los sitios también persigue vulnerabilidades de WP. Además, no visite ninguno de estos sitios a menos que use un navegador de texto como Curl.
closetnoc
@closetnoc, estos spammers no están registrados en mi servidor. Como escribí, están enviando spam directamente a GA. Yo no uso WP. "incluir el spam de referencia en cuestión": ¿qué quiere decir?
user626528
Sé quiénes son y publiqué una respuesta.
closetnoc
Definitivamente, la mejor y más fácil manera de evitar esto es usar: referrerspamblocker.com Es una configuración automática de filtros en Google Analytics. Lo he estado usando por meses ahora.
Rody van Sambeek
¿Establecer 'filtrado de bot' en verdadero en la configuración de google analytics ayuda a resolver el problema? - lunametrics.com/blog/2014/08/07/…
sam

Respuestas:

7

El spam está fuera de control. La lista está creciendo y requiere mucho tiempo y ni siquiera es eficiente agregar un filtro para cada uno de los spammers, ya que la mayoría de ellos aparecen durante unos días y luego desaparecen y aparece uno nuevo.

Hay mucha información errónea, el error más común es recomendar el uso de .htaccess , este archivo bloquea el acceso al sitio web, aunque hay algunos rastreadores (5 o 6) que pueden bloquearse, la gran mayoría del spam Nunca acceda a su sitio es Ghost Spam.

La mejor manera de detener este tipo de spam (Ghosts) es creando un filtro de nombre de host válido , el spam fantasma usa un nombre de host falso o no establecido, por lo que con este filtro no tiene que agregar filtros interminables, un filtro tomará cuidado del viejo y nuevo spam. . He estado usando esta solución con éxito durante 3 meses.

Más información sobre este método aquí:

https://stackoverflow.com/a/28354319/3197362

Carlos Escalera Alonso
fuente
Me alegra que esta sea la respuesta aceptada, realmente debería ser más apreciada. La gran mayoría de los referentes de spam en Analytics son referentes fantasmas. Hay algunos con los que debes bloquear .htaccess, pero esa es una batalla continua para evitar que sesguen las cifras (Semalt es el principal culpable de esto, legítimo bot, mi tía Fanny).
GeoffAtkins
Oh Carlos, estoy a punto de recomendar la guía para combatir el spam en tu sitio . Sé que este comentario será percibido como una forma de SEO / vender, pero no lo es. Realmente admiro su aporte en esa guía.
Ooker
35

Bueno. Sin conocer los sitios en cuestión, intentaré explicar un poco de lo que está sucediendo y proporcionaré solo algunos enlaces.

De: http://www.cradlecloud.com/ban-block-blackhatworth-com-spam-referrals/

Recibo los siguientes nombres de dominio asociados con el nuevo método de spam de referencia que las personas ven últimamente.

  • BlackHatWorth.com
  • Iskalko.ru
  • Lomb.co
  • Lombia.co
  • Econom.co
  • Darodar.com
  • ILoveVitaly.Com
  • Priceg.com
  • Hulfingtonpost.com (nuevo, agregado el 16 de enero de 2015)
  • Bestwebsitesawards.com (Nuevo: agregado el 3 de febrero de 2015)
  • Ranksonic.info (Nuevo: agregado el 3 de febrero de 2015)
  • Cenoval.ru (Nuevo- agregado el 6 de febrero de 2015)
  • oo-6-oo.com (Nuevo- agregado el 25 de febrero de 2015)
  • Humanorightswatch.org (Nuevo: agregado el 4 de marzo de 2015)
  • S.click.aliexpress.com (Nuevo- agregado el 17 de marzo de 2015 - Sospechoso)
  • www1.social-buttons.com (Nuevo- agregado el 23 de marzo de 2015 - Sospechoso)
  • 4webmasters.org (Nuevo - agregado el 26 de marzo de 2015 - Sospechoso)
  • Googlsucks.com (nuevo, agregado el 07 de abril de 2015)
  • Addons.mozilla.org (Nuevo- agregado el 07 de abril de 2015 - Sospechoso)
  • Smallseotools.com (Nuevo- agregado el 13 de abril de 2015 - Sospechoso)
  • Theguardlan.com (nuevo, agregado el 14 de abril de 2015)
  • Buy-cheap-online.info (Nuevo- agregado el 16 de abril de 2015 - Sospechoso)
  • Site1.free-share-buttons.com (Nuevo- agregado el 29 de abril de 2015 - Sospechoso)
  • Sanjosestartups.com (Nuevo: agregado el 25 de mayo de 2015)
  • Trafficmonetize.org (Nuevo: agregado el 3 de junio de 2015 - Sospechoso)
  • Howtostopreferralspam.eu (Nuevo- agregado el 9 de junio de 2015 - Sospechoso)
  • Www10.free-social-buttons.com (Nuevo- agregado el 16 de junio de 2015 - Sospechoso)
  • Getitfree.us (Nuevo - agregada el 18 de junio de 2015 No se puede determinar la propiedad. Gracias - Trey Copeland)
  • Www6.free-social-buttons.com (Nuevo- agregado el 18 de junio de 2015 - Sospechoso)
  • Erot.co (Nuevo: agregado el 26 de junio de 2015 - Sospechoso)
  • 3g2upl4pq6kufc4m.onion (Nuevo - agregado el 4 de julio de 2015 - Sospechoso)
  • Traffic2money.com (Nuevo: agregado el 28 de julio de 2015 - Sospechoso)

Nota: Los artículos sospechosos parecen seguir el mismo patrón de propiedad y no pueden estar vinculados al mismo delincuente.

Puede encontrar una lista bastante exhaustiva de referencias de spam mantenidas por Piwik aquí: https://github.com/piwik/referrer-spam-blacklist/blob/master/spammers.txt (Gracias - usuario2428118)

Citar:

BlackHatWorth.com es un dominio relativamente nuevo creado solo el 7 de enero de 2015 que ahora se utiliza para el spam de referencia. De hecho, este sitio web de spam de referencia se oculta detrás del nombre del motor de búsqueda de compras y de hermosas imágenes de paisajes.

... la dirección IP de BlackHatWorth.com que es 78.110.60.230 es la misma asociada con otros sitios web de referencia de spam ...

De hecho, el dominio BlackHatWorth.com es propiedad del mismo ruso que posee los otros dominios de referencia de spam como ILoveVitaly.com, Econom.co y Darodar.com. El nombre del propietario del dominio es supuestamente Vitaly A Popov de Samara (ciudad), Samaraskaya Oblast (estado), Rusia.

¡No puedes bloquear esto!

De: http://www.blackmoreops.com/2014/12/19/darodar-com-referrer-spam/

Citar:

Aquí hay una introducción rápida sobre cómo funciona Google Analytics.

Entonces, se configura en GA y se obtiene un código de ellos. El código se parece a UA-number-1 o algo así. Ese número es su "número de cuenta" en GA. Ahora, este código y un poco de javascript van a su página web. Ahora, alguien visita su página y su navegador ejecuta ese código javascript.

Ese código javascript es lo que "registra" su visita. Hace que su navegador hable con Google Analytics. Específicamente, realiza ciertos tipos de solicitudes HTTP sobre las que Google registra información, y luego GA le muestra resúmenes de esa información.

Bastante básico, ¿verdad? ¿Aún conmigo? Bien, ahora, si todo lo que es es este Javascript que les envía la "visita", entonces cualquiera puede fingir eso. Alguien en absoluto. Todo lo que tengo que hacer para que su GA muestre información falsa es enviar mi información falsa directamente a GA.

No necesito visitar su sitio en absoluto. No necesito ejecutar javascript en absoluto. Solo necesito reproducir esas solicitudes HTTP, que son públicas y para que cualquiera pueda verlas y cómo funcionan. Incluso están bastante bien documentados, públicamente, por los propios Google.

Entonces, ahora, digamos que soy un idiota spammer. Quiero que la gente vea mi sitio de spam. ¿Entonces qué hago? Escribo un pequeño código para enviar miles y miles de estas solicitudes falsas a GA, y simplemente paso por todos los números de UA, en orden, al azar, lo que sea. Envío una visita falsa, con un referente falso y mi nombre de dominio spam. ¿Y adivina qué? Aparece en las pantallas de Google Analytics.

Ves este spam como cualquier otra visita normal. Porque en lo que respecta a GA, fue una visita normal. Todo lo que están grabando son las solicitudes HTTP, que normalmente provienen del código JavaScript de GA. Pero una solicitud es una solicitud, y hacer una falsa es muy, muy fácil.

Eso es lo que está pasando. Todo lo que necesito es su número de UA y con solo un pequeño esfuerzo puedo fingir una visita a su sitio sin tener que conectarme a él. Esa visita falsa puede tener cualquier nombre de dominio y cualquier referencia que yo elija.

Este es un ataque a Google Analytics, para promocionar cualquier sitio que aparezca. No puede bloquearlo en su servidor, porque su servidor no está involucrado en absoluto.

Puede hacer dos cosas: una, configurar un filtro como sugiere John Conde; y dos, ver si hay una manera de informar a Google. Para eso no tengo una respuesta, pero tengo una idea.

[Actualizar]

Esto está comenzando a alcanzar proporciones escandalosas de cientos de ataques de spam por día para completar publicidad como esta:

ingrese la descripción de la imagen aquí

closetnoc
fuente
2
@JohnMueller Esto no puede estar dentro de su reino, pero ¿puede enviar algunos correos electrónicos para ver si G tiene conocimiento sobre esto? ¡¡Gracias por adelantado!!
closetnoc
2
@JohnConde ¡Gracias! John Mueller puede no saber sobre esto, pero alguien en G debería. Incluso si no hay respuesta, al menos G debería tener un aviso si aún no lo tiene. Es lo correcto para todos nosotros. ¡Aclamaciones!
closetnoc
1
@JohnConde BTW- Vi preguntas sobre esto en otros sitios de SE (y posiblemente relacionados). No tomé notas, pero ¿hay una buena manera de transmitir una nota a los otros Mods? ¿O debería simplemente buscar en Google estos nombres de dominio y buscar respuestas y publicar?
closetnoc
1
@joelmdev Has perdido el punto de que no se pueden bloquear. Este es un ataque directo a Google. Nadie tiene ningún control, excepto Google. Han sido notificados y estos se han detenido en su mayor parte.
closetnoc
2
@ Steve No puedo ver que haya una gran recompensa, sin embargo, tiene que haber una en alguna parte. La persona mencionada en la respuesta odia a Google y probablemente quiera avergonzar a Google como mínimo. Pero también están usando claramente este spam para dirigir el tráfico a varios sitios web que siguen siendo registrados. Incluso he visto algo así como un anuncio usando este método. ¡Es molesto como el infierno! Está lastimando a personas inocentes más que a Google realmente. Supongo que funciona ... muy triste.
closetnoc
5

Puede excluirlos creando un filtro . Debe encontrar algo lo suficientemente específico como para no bloquear accidentalmente a los buenos visitantes y es tedioso ya que tiene que agregar manualmente cada spammer, pero esto será el truco.

John Conde
fuente
¿Tiene algún consejo de IIS que pueda ayudar? Puedo ayudar con Apache, pero el OP parece tener IIS.
closetnoc
2
Si no están visitando su sitio web, que es lo que creo que dijeron, entonces este no sería un método efectivo para bloquearlos. ¿O leí mal la pregunta?
John Conde
Lo leí ya que el OP está recibiendo visitas con spam de referencia.
closetnoc
2
De hecho, pero aparentemente están golpeando GA directamente en lugar de golpear su sitio. It seems these spammers are using scripts to spam directly to GA (i.e. they are not logged in my IIS).
John Conde
Bueno. Tienes razón. ¡¡Mi error!! No estoy seguro de por qué no lo aprendí porque estaba leyendo sobre esto justo antes de esta pregunta. También me golpea el spam de referencia y un artículo menciona (brevemente) que no había entradas en sus archivos de registro. Interesante nuevo método.
closetnoc
4

Para responder directamente a la pregunta del título "Cómo luchar contra los spammers de referencia", la respuesta más simple es abandonar Google Analytics y cambiar a Piwik , que bloquea automáticamente todo el spam de referencia de forma predeterminada .

Me doy cuenta de que probablemente estás acostumbrado a Google Analytics y deseas seguir usándolo, pero si miras la imagen más grande, tienes otra opción que funciona muy bien. Piwik también se puede configurar para registrar las direcciones IP de los visitantes si lo desea, y no filtra datos de visitantes a compañías de publicidad de terceros que pueden atraer a algunos usuarios.

Tom Brossman
fuente
2
Por cierto, la lista negra de spam de referencia que utiliza Piwik es de código abierto: github.com/piwik/referrer-spam-blacklist
Matthieu Napoli
su base de datos de spam es bastante pequeña. ni siquiera los dominios mencionados en mi informe de análisis.
Don Dilanga
1

Aquí hay una regla que funciona en IIS:

<rewrite>
  <rules>
    <rule name="abort referer spam requests" stopProcessing="true">
      <match url=".*" />
      <conditions>
        <add input="{HTTP_REFERER}" pattern="(semalt\.com)|(buttons\-for\-website\.com)" />
      </conditions>
      <action type="AbortRequest" />
    </rule>
    <!--The rest of your rules, if you have any-->
  </rules>
</rewrite>
Flo
fuente
2
Esta respuesta no tiene nada que ver con la pregunta de OP, ya que los spammers envían spam directamente a Google Analytics sin pasar por el servidor web de OP.
Alfred Myers
@AlfredMyers Su comentario es parcialmente cierto ya que algunos spammers SÍ usan el método de servidor web, otros usan el método directo como usted menciona. En el último caso, la única solución es agregar filtros en Google Analytics para obtener informes limpios. Para evitar esto, preferiría que Google usara un identificador único con hash más largo para las cuentas de GA, de modo que los spammers no puedan simplemente recorrer los números disponibles y realizar consultas.
Flo
El OP establece específicamente "... estos spammers están utilizando scripts para enviar spam directamente a GA (es decir, no están registrados en mi IIS)". Entonces, para esta pregunta específica, no están accediendo a su servidor web.
Alfred Myers,
1

En caso de que todavía esté buscando una solución y no pueda entender las referencias hechas, aquí está la Guía definitiva para eliminar el spam de referencias, ahora en su revisión número 133 desde el 28 de diciembre de 2014: http://www.analyticsedge.com/2014 / 12 / remove-referral-spam-google-analytics /

TL; DR:

  • un filtro de nombre de host válido eliminará todas las referencias de fantasmas (Incluir nombre de host midominio.com)

  • un filtro de exclusión específico (o bloqueo del sitio web) eliminará la lista mucho más corta de rastreadores de correo no deseado (semalt.com | kambasoft.com | 7makemoneyonline.com | best-seo-offer.com | best-seo-solution.com | botones-para -website.com | buttons-for-your-website.com | -musicas * -gratis | anticrawler.org | savetubevideo.com | ranksonic)

  • Se puede utilizar un segmento avanzado para eliminarlos de sus informes históricos.

El segmento avanzado se puede importar desde la Galería de soluciones de Google Analytics: https://www.google.com/analytics/gallery/#posts/search/%3F_.sort%3DDATE%26_.start%3D0%26_.type%3DADVANCED_SEGMENT % 26_.viewId% 3DGjpPQhFgS9aVzniXH4MTIg /

Mike Sullivan
fuente
0

A principios del año pasado, tuve la tarea de encontrar la mejor solución posible para el spam de Google Analytics. Como todos los demás, probé los enfoques recomendados, pero nada parecía funcionar tan bien. Entonces, luego recurrí al Administrador de etiquetas de Google, pero eso tampoco pareció ayudar mucho. Frustrado y molesto, decidí reconstruir el script de seguimiento de Google Analytics, incorporando contramedidas contra las formas más comunes y molestas de spam.

Si bien no es perfecto, después de ~ 1.5 años de construcción, prueba, depuración y refactorización constantes, ahora tengo un script de seguimiento de Google Analytics bastante confiable que funciona bien desde el primer momento y es fácilmente personalizable. Para aquellos que desean cumplir con las métricas, esto funciona como un encanto.

https://github.com/nickolasburr/intelligent-ga-tracking

nburr
fuente