Actualmente estoy trabajando en una tarea de pronóstico de demanda, con datos sobre decenas de miles de productos en un par de miles de tiendas. Más específicamente, tengo unos pocos años de datos de ventas diarias por producto en cada tienda, y mi objetivo es pronosticar las ventas futuras de cada artículo en cada tienda, un día antes; luego dos días por delante, etc.
Hasta ahora he considerado dividir cada par de productos y tiendas en una sola serie de tiempo, y hacer un pronóstico para cada serie de tiempo como se hizo en el documento de Neal Wagner, Técnicas inteligentes para pronosticar múltiples series de tiempo en sistemas del mundo real . En otras palabras, usaré solo la información histórica de las ventas del producto en una tienda en particular para pronosticar las ventas futuras de ese producto en esa tienda.
Sin embargo, he estado navegando en Kaggle y competiciones como Corporación Favorita Grocery Sales Forecasting sugieren un enfoque diferente, que consiste en utilizar la información de todas las tiendas y todos los productos para predecir las ventas futuras. Según tengo entendido, la información histórica de ventas de todos los productos en todas las tiendas se vierte en el conjunto de capacitación, desde el cual el modelo aprenderá a pronosticar las ventas futuras. Es muy diferente de los métodos tradicionales de series de tiempo, pero aparentemente, según los resultados de la competencia, funciona.
El último método parece prometedor y más robusto. Sin embargo, existe el problema de tener que procesar cientos de millones de puntos de datos.
¿Qué método es más apropiado para mi tarea? Para aquellos que han trabajado en problemas similares, ¿qué metodología recomendarían?
Respuestas:
No recomendaría el enfoque utilizado por Neal et al. . Sus datos son únicos por dos razones:
Están trabajando con datos de alimentos, que generalmente son más densos y más estables que otros datos de productos minoristas. Un lugar determinado estará vendiendo docenas de cartones de leche o paquetes de huevos por semana y habrá estado vendiendo esos mismos productos durante décadas, en comparación con la moda o las piezas de automóviles, donde no es raro tener ventas de un solo artículo cada 3 o 4 semanas, y datos disponibles por solo un año o dos.
Están pronosticando almacenes, no tiendas. Un único almacén cubre varias tiendas, por lo que sus datos son aún más densos que el promedio. De hecho, un almacén se usa típicamente como un nivel de agregación / agrupación natural para las tiendas, por lo que ya están esencialmente realizando una agrupación de datos de la tienda.
Debido a la naturaleza de sus datos, pueden salirse con la suya modelando series de tiempo individuales directamente. Pero la información de la mayoría de los minoristas sería demasiado escasa a nivel de sku / tienda individual para que puedan lograrlo.
Como dijo zbicyclist, este problema generalmente se aborda mediante pronósticos jerárquicos o de niveles múltiples . Todos los paquetes de pronóstico de demanda comercial utilizan alguna forma de pronóstico jerárquico
La idea es agrupar productos y tiendas en productos y regiones similares, para los cuales se generan pronósticos agregados y se utilizan para determinar la estacionalidad y tendencia general, que luego se distribuyen conciliados utilizando un enfoque de arriba hacia abajo con los pronósticos de línea de base generados para cada sku individual / tienda de combinación.
Además del desafío mencionado por zbicyclist, un problema mayor es que encontrar las agrupaciones óptimas de productos y tiendas no es una tarea trivial, que requiere una combinación de experiencia en el dominio y análisis empírico. Los productos y las tiendas generalmente se agrupan en jerarquías elaboradas (por departamento, proveedor, marca, etc. para productos, por región, clima, almacén, etc. para ubicación) que luego se envían al algoritmo de pronóstico junto con las ventas históricas. datos en sí.
Abordar comentarios de meraxes
Están haciendo la agrupación implícitamente usando store, item, famlily, class, cluster como características categóricas.
Tres puntos con respecto a esto:
fuente