Al principio no es irrazonable trazar los gráficos de líneas como una serie de pequeños múltiplos, con diferentes escalas para el eje Y pero con el eje X (fechas) alineado.
Creo que este es un buen comienzo, ya que permite examinar los datos en bruto y permite comparar tendencias entre diferentes gráficos de líneas. En mi opinión, primero debe mirar los datos en bruto, luego pensar en las conversiones o formas de normalizar los gráficos para que sean comparables después de examinar los datos en bruto.
Como King ya ha mencionado, parece que sus variables tienen un orden natural basado en los nombres y números, y suponiendo que sea apropiado, creé tres nuevas variables basadas en el porcentaje convertido en cada estado. Las nuevas variables son;
% Carts Created = Carts_Created/Visits
% Orders Created = Orders_Created/Carts_Created
% Carts Converted = Carts_Converted/Orders_Created
Hacer porcentajes es una manera de acercar la serie a una escala común, pero aun así, colocar todas las líneas en un gráfico (como a continuación) sigue siendo difícil visualizar la serie de manera efectiva. El nivel y la variación de los pedidos creados y los carros convertidos en serie enanan el de las otras series. No puede ver ninguna variación en la serie de carros creados en esta escala (y sospecho que es la que más le interesa).
Entonces, nuevamente, en mi opinión, una mejor manera de examinar esto es usar diferentes escalas. A continuación se muestra el gráfico de porcentajes con diferentes escalas.
Con estos gráficos, no parece haber una correlación significativa entre las series, pero sí hay muchas variaciones interesantes dentro de cada serie (especialmente la proporción convertida). ¿Qué pasa con 2011-11-13
? Tuviste una proporción mucho menor de pedidos creados, pero cada uno de los pedidos creados fue un carrito convertido. ¿Tuviste alguna otra intervención que pudiera explicar las tendencias en las visitas al sitio o en los carritos de proporción o porcentaje creados?
Todo esto es solo un análisis de datos exploratorio, y para tomar más medidas necesitaría más información sobre los datos (aunque espero que este sea un buen comienzo). Podría normalizar los gráficos de líneas de otras maneras para poder trazarlos en una escala comparable, pero esa es una tarea difícil, y creo que se puede hacer como elegir efectivamente escalas arbitrarias basadas en lo informativo dados los datos en lugar de elegir algunos esquemas de normalización predeterminados. Otra aplicación interesante de ver muchos gráficos de líneas simultáneamente son los gráficos de horizonte , pero es más para ver muchos gráficos de líneas diferentes a la vez.
Puede tener 2 ejes y separados, Visitas (k) y Carros creados en uno, los otros 2 en otro (o de cualquier manera que se ajuste a su propósito).
Definitivamente, este no es un método elegante, pero recuerdo haberlo hecho hace años cuando solo quería comparar tendencias a lo largo del tiempo.
O
Simplemente puede trazar el cambio porcentual a lo largo del tiempo si se adapta a su propósito.
fuente
Al final decidí normalizar los datos dividiendo cada valor por el valor máximo y luego multiplicándolo por 100.
Encuentra el valor máximo:
Divide cada número entre el máximo y luego multiplica por 100:
Luego tracé esto en el gráfico, obviamente esto solo demuestra la tendencia y el usuario tiene la tabla de datos en la parte inferior de la página.
fuente
Ese sería mi enfoque también: ajustar las diferentes dimensiones a la misma escala dividiendo por X, pero usaría el valor promedio, no el valor máximo o mínimo. La razón es que, a medida que agrega datos a lo largo del tiempo, es probable que su máximo o mínimo cambie, y luego lo que era 100% en el último gráfico es algo más esta vez: el gráfico no es tan fácil de conciliar con gráficos anteriores, si usa avg, entonces los cambios no son tan drásticos.
fuente