RFM y modelado de valor de vida del cliente en R

12

¿Alguien puede decirme cómo hacer modelos de actualidad, frecuencia y valor monetario (RFM) y modelos de valor del cliente en R?

Además, ¿alguien puede recomendarme algo de literatura al respecto?

Beta
fuente
1
También puede ver el paquete BTYD en R. O comprar el paquete hasta que muera. Creo que Bruce Hardie es uno de los autores. Aunque no estoy muy seguro.

Respuestas:

10

En cuanto a las referencias, la minería de datos mediante el análisis RFM debería ayudar en lo que respecta a la terminología y otras referencias.

Una de las formas más simples (y populares) de modelar la probabilidad de respuesta del cliente es usar la regresión logística con RFM como variables explicativas (entre otras variables disponibles).

Para modelar el valor monetario, uno podría simplemente hacer retroceder los ingresos en RFM directamente (mediante el uso de un modelo lineal simple para empezar), lo que generalmente funciona sorprendentemente bien. Los modelos más avanzados / no lineales (como Random Forest o Gradient Boosting Machine) funcionan mejor que los modelos lineales en mi experiencia.

Otro enfoque popular es construir un modelo un poco más complejo para predecir el valor monetario basado en dos submodelos: uno para la probabilidad de respuesta (por ejemplo, utilizando la regresión logística como una función de RFM), y el otro para los ingresos condicionales a la respuesta (nuevamente, podría ser tan simple como un modelo lineal de RFM). El valor monetario esperado es el producto de las dos predicciones.

Si se dispone de datos aleatorios de prueba / control, las técnicas basadas en levantamiento / levantamiento de red son bastante populares para modelar el beneficio incremental de un tratamiento.

En cuanto al valor del ciclo de vida del cliente, consulte Modelado del valor de la vida útil del cliente para una revisión y referencias adicionales.

Con respecto al modelado en R, no conozco ningún paquete "estándar" para ese tipo de modelado. Sin embargo, R proporciona todos los bloques de construcción necesarios para eso (a menos que tenga una gran cantidad de datos, en ese caso es posible que deba confiar en herramientas más escalables)

Yevgeny
fuente
1
Muy buena respuesta, pero creo que el primer enlace podría estar roto.
Dimitriy V. Masterov
@Yevgeny, tengo dos preguntas con respecto a las sugerencias que ha dado. Primero, en cuanto a modelar el valor monetario, ¿está bien retroceder los ingresos usando Monetario entre las variables predictoras? Me temo que serán la misma variable. En segundo lugar, ¿tiene algún recurso en línea que pueda ayudarme a comprender cómo llevar a cabo una regresión lineal condicional a la respuesta (utilizando el segundo enfoque que describió)? ¡Muchas gracias!
nhern121
1) Está bien siempre y cuando no esté confundiendo las variables explicativas / de entrada (de datos pasados) y la variable objetivo (de datos "futuros") 2) Simplemente elija el subconjunto de datos donde los clientes compraron algo y regrese los ingresos en las variables explicativas
Yevgeny
5

No estoy seguro si todavía está trabajando en el modelado RFM. Aquí ( pdf ) hay un artículo / la viñeta para el paquete BTYD en R que podría serle útil. Todo el artículo está basado en R y tiene 3 modelos diferentes para mirar. En la página 1, 2.1 Preparación de datos, puede ver el contexto sobre los RFM.

agudo
fuente
Gracias Gung! Aunque en este momento no estoy trabajando en eso. Pero esto es de gran ayuda. Además, podría ser útil para otras personas que están trabajando en ello ahora.
Beta el