Por lo tanto, estoy tratando de comprender mejor los gráficos de elevación y ganancia según se aplica a mi modelo de rotación de empleados (es decir, CHAID utilizado en SPSS Modeler). Para mis datos, esto significa predecir el número de personas que abandonan voluntariamente la empresa.
He revisado las referencias a continuación y tengo los conceptos básicos sobre la interpretación: lo que se traza en los ejes xey, y la curva ideal que está buscando. Incluso practiqué la construcción de mis propias tablas de ganancias y levantamientos en Excel.
Pero todos los ejemplos que he visto hasta ahora son para una campaña de correo directo. Ahora quiero saber qué significa esto para mis datos. ¿Significa simplemente, en el caso del gráfico de ganancias, que si muestreo el 10% superior de mis datos, puedo esperar el 40% de los términos frente al muestreo del 60% de los datos que obtienen el 80% de los términos? (suponga que el 40% y el 60% son los valores). Si es así, ¿qué importancia debo quitar de eso porque realmente no lo entiendo en el contexto de mi modelo de rotación?
Referencias
levantar-medir-en-minería de datos
¿Qué es un gráfico de elevación?
http://www2.cs.uregina.ca/~dbd/cs831/notes/lift_chart/lift_chart.html
fuente
Respuestas:
A veces es útil imaginar el objetivo de dicho análisis y lo que una empresa puede hacer sin uno. Supongamos que la empresa a la que pertenecen los datos de rotación desea hacer algo en contra de una tasa de rotación (posiblemente) alta. Me imagino dos acciones posibles
Entonces, por qué es importante ?
Los gráficos de elevación son principalmente importantes para el segundo caso de uso. ¿Imagina lo que puede hacer una empresa cuando ha decidido invertir dinero hablando con los empleados 1 a 1 pero no tiene un modelo? La única opción es hablar con todos o con todos en una muestra aleatoria de un tamaño fijo. Hablar con todos, a pesar de la ganancia de identificar a todos los posibles partidarios, es demasiado costoso. Pero cuando solo se selecciona una muestra aleatoria para hablar, solo se identifica una fracción de todos los posibles partícipes mientras se sigue gastando mucho dinero. En ambos casos, la relación costo-por-licencia-prevención es bastante alta.
Pero cuando existe un buen modelo, la compañía puede decidir hablar solo con aquellos que tienen la mayor probabilidad de irse (aquellos con los puntajes más altos de acuerdo con el modelo), de modo que se identifique a más posibles partícipes, optimizando así el costo por -prevención-abandono .
Eche un vistazo nuevamente a las dos primeras tablas aquí: http://www2.cs.uregina.ca/~dbd/cs831/notes/lift_chart/lift_chart.html . Digamos que "clientes" = "empleados" y "encuestados positivos" = "posibles partícipes" (ver datos a continuación).
Si la compañía decide que solo puede gastar suficiente dinero para hablar con 10000 empleados, identificará
lo que significa
El eje x en ambos casos muestra el porcentaje de empleados contactados, en este ejemplo específico 10%.
Apéndice
Los datos utilizados para hacer esta pregunta independiente de la pudrición del enlace.
Tasa global
Efectividad del modelo cuando se contacta a los empleados en trozos de 10000
fuente