¿Es posible entender el modelo pareto / nbd conceptualmente?

12

Estoy aprendiendo a usar el paquete BTYD que usa el modelo Pareto / NBD para predecir cuándo se espera que regrese un cliente. Sin embargo, toda la literatura sobre este modelo está llena de matemáticas y no parece haber una explicación simple / conceptual del funcionamiento de este modelo. ¿Es posible entender el modelo Pareto / NBD para no matemáticos? He leído este famoso artículo de Fader . El modelo Pareto / NBD hace los siguientes supuestos:

yo. Mientras está activo, el número de transacciones realizadas por un cliente en un período de tiempo t se distribuye en Poisson con la tasa de transacción λ.

ii. La heterogeneidad en las tasas de transacción entre los clientes sigue una distribución gamma con el parámetro de forma r y el parámetro de escala α.

iii) Cada cliente tiene una "vida útil" no observada de longitud τ. Este punto en el que el cliente se vuelve inactivo se distribuye exponencialmente con la tasa de abandono µ.

iv) La heterogeneidad en las tasas de abandono entre los clientes sigue una distribución gamma con parámetros de forma s y parámetro de escala β.

v. La tasa de transacción λ y la tasa de deserción µ varían independientemente entre los clientes ".

No entiendo la razón (intuición detrás) de los supuestos (ii), (iii) y (iv). ¿Por qué solo estas distribuciones, por qué no otras?

También los supuestos del modelo BG / NBD son:

i.) Mientras está activo, el número de transacciones realizadas por un cliente sigue un proceso de Poisson con una tasa de transacción λ. Esto es equivalente a suponer que el tiempo entre transacciones se distribuye exponencialmente con la tasa de transacción λ

ii) La heterogeneidad en λ sigue una distribución gamma

iii) Después de cualquier transacción, un cliente queda inactivo con probabilidad p. Por lo tanto, el punto en el que el cliente "abandona" se distribuye entre las transacciones de acuerdo con una distribución geométrica (desplazada) con pmf

iv) La heterogeneidad en p sigue una distribución beta

La racionalidad (intuitiva) de los supuestos (ii), (iii) y (iv) tampoco es nada obvio.

Estaré agradecido por cualquier ayuda. Gracias.

usuario3282777
fuente
¿Podría agregar alguna referencia a la literatura que le resulte difícil?
kjetil b halvorsen
He elaborado dónde las cosas no están claras. Sé que no es fácil llevar la intuición al juego, pero si fuera posible, sería de gran ayuda. Gracias.
user3282777

Respuestas:

14

Imagina que eres el gerente recientemente designado de una florería. Tienes un registro de los clientes del año pasado: la frecuencia con la que compran y cuánto tiempo desde su última visita. Desea saber cuánto negocio es probable que traigan los clientes listados este año. Hay algunas cosas a considerar:

[suposición (ii)] Los clientes tienen diferentes hábitos de compra.

A algunas personas les gusta tener flores frescas todo el tiempo, mientras que otras solo por ellas en ocasiones especiales. Tiene más sentido tener una distribución para la tasa de transacción , en lugar de asumir que una sola explica el comportamiento de todos.λλλ

La distribución debe tener pocos parámetros (no necesariamente tiene muchos datos), ser bastante flexible (presumiblemente no es un gurú emprendedor que lee la mente y no sabe todo sobre los hábitos de compra), y tomar valores en los números reales positivos. La distribución Gamma cumple todos esos requisitos, y está bien estudiada y es relativamente fácil trabajar con ella. A menudo se usa como previo para parámetros positivos en diferentes configuraciones.

[supuesto (iii)] Es posible que ya haya perdido algunos de los clientes en la lista.

Si Andrea ha comprado flores aproximadamente una vez al mes cada mes en el último año, es una apuesta bastante segura que regresará este año. Si Ben solía comprar flores semanalmente, pero no ha existido durante meses, entonces tal vez haya encontrado una florería diferente. Al hacer planes de negocios futuros, es posible que desee contar con Andrea pero no con Ben.

Los clientes no le dirán cuándo se mudaron, que es donde entra en juego la suposición de “vida no observada” para ambos modelos. Imagine un tercer cliente, Cary. Los modelos Pareto / NBD y BG / NBD le ofrecen dos formas diferentes de pensar en el abandono de Cary para siempre.

Para el caso de Pareto / NBD, imagine que en cualquier momento hay una pequeña posibilidad de que Cary pueda encontrar una tienda mejor que la suya. Este riesgo infinitesimal constante le brinda una vida exponencial, y cuanto más tiempo ha pasado desde la última visita de Cary, más tiempo ha estado expuesto a otras (potencialmente mejores) florerías.

El caso BG / NBD es un poco más artificial. Cada vez que Cary llega a tu tienda, se compromete a comprar algunas flores. Mientras navega, considerará los cambios en el precio, la calidad y la variedad desde su última visita, y eso finalmente lo hará decidir si volverá la próxima vez o buscará otra tienda. Entonces, en lugar de estar constantemente en riesgo, Cary tiene alguna probabilidad de decidir irse después de cada compra.

[supuesto (iv)] No todos los clientes están igualmente comprometidos con su tienda.

Algunos clientes son clientes habituales, y solo la muerte, o un fuerte aumento de precios, los obligará a irse. A otros les gustaría explorar, y felizmente lo dejarían por el bien de la nueva tienda de flores hipster al otro lado de la calle. En lugar de una única tasa de deserción para todos los clientes, tiene más sentido tener una distribución de las tasas de deserción (o probabilidades en el caso de BG / NBD).

Esto funciona mucho en la misma línea que los hábitos de compra. Buscamos una distribución flexible y bien establecida con pocos parámetros. En el caso de Pareto / NBD usamos un Gamma, ya que la tasa está en los números reales positivos. En el caso de BG / NBD usamos una Beta, que es el estándar anterior para los parámetros en .( 0 ; 1 )μ(0;1)

Espero que esto ayude. Si aún no lo ha hecho, eche un vistazo al documento original (Schmittlein et al., 1987), ya que revisan algunas de las intuiciones allí.

Lyuba B.
fuente
Gracias por el trabajo tan duro y la explicación clara. La razón para usar la distribución Gamma es que es relativamente fácil de trabajar y a menudo se usa como previo para parámetros positivos en diferentes configuraciones. Si bien las formas de la mayoría de la distribución gamma (con diferentes valores de parámetros) son fáciles de comprender, pero para ajustar 'Heterogeneidad en las tasas de transacción entre clientes' a una distribución gamma que casi cae exponencialmente (para k = 1, theta = 2 como en el gráfico de Wikipedia [ aquí] es.wikipedia.org/wiki/Gamma_distribution ) es poco difícil de comprender. ¿Excluimos tal comportamiento?
user3282777
1
Sus estimaciones para los parámetros Gamma dependerán de los datos con los que esté trabajando. El punto es que la distribución Gamma puede tener formas significativamente diferentes basadas en solo dos parámetros, y puede dejar que los datos hablen por sí mismos, sin imponer suposiciones excesivamente estrictas (más o menos).
Lyuba B.