Análisis: CloudFlare vs Google - ¿Qué discrepancia es demasiado grande?

10

He estado usando CloudFlare para uno de nuestros sitios durante aproximadamente una semana, y CloudFlare informa un 450% más de visitas a páginas de visitantes reales que Google Analytics (por lo que no son bots ni amenazas bloqueadas).

Entiendo que habrá discrepancias porque CloudFlare está midiendo todas las solicitudes de página, Google Analytics está rechazando una solicitud de JavaScript una vez que la página se ha descargado, así que estaba preparado para una diferencia del 20-30%, quizás del 50%, pero ¿450%?

Parece que hay un problema en alguna parte. He usado el depurador de Google Analytics para Chrome y todo parece funcionar bien. El código GA está en la cabeza, por lo que debe dispararse con bastante rapidez.

¿Es normal una brecha tan grande? Si es así, ¿por qué y si no, qué demonios lo está causando?

actualizado

Lo siento, no creo que haya sido claro, entendí las diferencias entre las estadísticas de CF y GA antes de comenzar con CF, y esperaba que fueran diferentes. Es el tamaño de la diferencia lo que preocupa.

CF separa claramente a los robots y rastreadores de los visitantes habituales, por lo que la cifra que estoy comparando con GA son solo los visitantes habituales; Entonces, ¿la diferencia dice que solo 1 de cada 5 visitantes activa Google Analytics ?

"your CloudFlare visitor number is most likely higher"

¡No le hace justicia!

CodeMonkey
fuente
Tengo el mismo problema con una discrepancia aún mayor. Creo que el número de visitantes puede ser la razón. ¿Cuántas páginas vistas visualiza su GA durante un mes? Para mí, el número de visitas a la página informadas por CF durante un período específico es de 223.000.000, mientras que el número informado por GA es de 22.000.000. Esto definitivamente no puede deberse a robots o .js. Creo que esto se debe al límite de datos de GA según lo informado por sí mismo, no garantizan la entrega de datos correctos para más de 10 millones de visitas al mes. De todos modos, esto es lo que pienso y aún no estoy seguro.
Manoochehr
Otra cosa: si una de sus imágenes está enlazada, probablemente provoque una visita a Cloudflare, mientras que no debería. Es complicado Yo diría que Google Analytics probablemente registrará visitas sólidas que Cloudflare.
David 天宇 Wong

Respuestas:

4

CloudFlare reconoce esto y proporciona la siguiente explicación :

CloudFlare Analytics vs. Otros servicios

Google Analytics y otros programas de análisis basados ​​en la web rastrean a los visitantes que activan JavaScript. Como resultado, las amenazas, los bots y los rastreadores automáticos no se registran, ya que estos visitantes generalmente no activan JavaScript. Estos servicios tampoco rastrean a los visitantes que abandonan una página antes de que esté completamente cargada o tengan Javascript deshabilitado. CloudFlare rastrea todo su tráfico por solicitudes, por lo que su número de visitante de CloudFlare es más probable.

Recuerde: CloudFlare solo puede rastrear a los visitantes que pasan por el sistema CloudFlare, que está representado por una nube naranja en su página de configuración de DNS.

Afirman que sus propios análisis "a menudo son más precisos que otros servicios que dependen de JavaScript".

Andrew Lott
fuente
gracias por su tiempo, pero entiendo el razonamiento, ¡es que mi mente está impresionada por la escala de la diferencia! Había actualizado mi pregunta con un poco más de detalle
CodeMonkey el
4

He observado diferencias similares al comparar registros de Apache con análisis y he visto una relación (un día) de 1000: 1. Es remotamente posible que tenga alguna base de usuarios que bloquee Google-Analytics con productos como NoScript y Ghostery, o que no ejecute ningún javascript. Descubrí que Piwik ofrece mejores informes y puede configurarse de modo que los bloqueadores de rastreadores no bloqueen su secuencia de comandos y los usuarios sin JavaScript aún puedan ser rastreados a través de un esquema de seguimiento de imagen de 1x1 píxeles. Sin embargo, no tengo experiencia real con CloudFlare o CDN en general, por lo que no sé si afecta los informes de Piwik.

Pablo
fuente
El 80% de bloqueo de GA me parece muy alto, ¿eso te parece normal? Por curiosidad, ¿qué utilizó para analizar los registros de apache y filtrar los bots y las amenazas?
CodeMonkey
Creo que el porcentaje típico de usuarios que bloquean activamente los complementos sería inferior al 5%, pero no tengo una base real para esto que no sea observar los hábitos de navegación de amigos, compañeros de trabajo, etc. Para los registros de Apache, solo uso AWStats - no No filtre nada, al menos no cómo lo tengo configurado. Me cambié a Piwik porque uno de mis sitios no ejecuta ningún script y para otros sitios me gustan más los informes.
Paul
2

No es tan difícil de entender por qué los números de Cloudflare son mucho más altos que usted GA. La razón es que Cloudflare es un intermediario. déjame explicarte en detalle.

Verá que cuando alguien va a un sitio web que usa Cloudflare, los usuarios envían una solicitud a Cloudflare, que es toda la información, como el agente de usuario IP y otros. así que ni siquiera importa si el usuario que usa las extensiones como el bloqueador de guiones u otros Cloudflare sabrá que alguien ha visitado su sitio.

¿Por qué los números son altos? Verá cuando un sitio se registre o un dominio para ser precisos, el hombre grande como Google envía sus bots para recopilar información. recuerde que no solo google envía sus bots, sino que hay muchos otros. Cloudflare tiene muchas maneras de saber que es un bot o una persona real, pero no estoy seguro de si separan o eliminan las visitas al bot.

Además, estas medidas para diferenciar pueden ser fácilmente engañadas.

conclusión: cada vez que se solicita su sitio web, agrega +1 al número total.

pensamientos adicionales: no estoy realmente seguro, pero si agrega un .js o .png o cualquier otro archivo en su sitio web. su navegador realiza una solicitud al enlace dado que también podría contar como una visita al sitio. Ej: si en una página hay 10 fotos y para cargar todas, su navegador solicita todas esas fotos individualmente, lo que puede hacer que el número de visitas sea del 1 al 11. (10 para fotos y una para HTML del sitio web)

usuario97589
fuente
1

Nunca he visto mi Cloudflare Analytics hasta ahora, pero los tuyos están realmente más cerca de Analytics que los míos. Cloudflare informa 20 veces la cantidad de visitas únicas en comparación con Google, y es aproximadamente lo mismo para las vistas de página.

nathangiesbrecht
fuente
Interesante, entonces, ¿es algo que probablemente investigará más?
CodeMonkey
Miré un poco a través de los registros, y parece que la mayoría de los bots causan la discrepancia. Eso, y tengo un verificador de "tiempo de actividad" que se ejecuta en Google Docs que llega al sitio cada 5 minutos.
nathangiesbrecht
1

Recientemente destruí un sitio web cliente basado en WP y encendí uno completamente nuevo. Al mismo tiempo, agregué CF a su nuevo sitio. Su antiguo sitio seguía alcanzando los límites del servidor antes de que los ladrones conectaran. Cuando creé el nuevo sitio, los frustré destruyendo todas las URL de imágenes antiguas. Ahora CF informa una cantidad de tráfico mucho mayor que GA y creo que es una gran cantidad de solicitudes al servidor que ahora son imágenes 404 no encontradas por todos los ladrones que conectan sus viejas imágenes. Solo mis dos centavos.

Christopher Scott
fuente