Supongamos que estoy construyendo un modelo predictivo en el que intento predecir múltiples eventos (por ejemplo, tanto el lanzamiento de un dado como el lanzamiento de una moneda). La mayoría de los algoritmos con los que estoy familiarizado trabajan con un solo objetivo, por lo que me pregunto si existe un enfoque estándar para este tipo de cosas.
Veo dos posibles opciones. Quizás el enfoque más ingenuo sería simplemente tratarlos como dos problemas diferentes y luego combinar los resultados. Sin embargo, eso tiene serios inconvenientes cuando los dos objetivos no son independientes (y en muchos casos pueden ser muy dependientes).
Un enfoque más sensato para mí sería hacer un atributo objetivo combinado. Entonces, en el caso de un dado y una moneda, tendríamos estados ( , etc.). Sin embargo, esto puede llevar a que el número de estados / clases en el objetivo compuesto se vuelva bastante grande con bastante rapidez (¿qué pasaría si tuviéramos 2 dados, etc.). Además, esto parece extraño en el caso de que un atributo sea categórico mientras que el otro sea numérico (por ejemplo, si predice la temperatura y el tipo de precipitación).
¿Hay algún enfoque estándar para este tipo de cosas? Alternativamente, ¿hay algún algoritmo de aprendizaje diseñado específicamente para manejar esto?
fuente
Respuestas:
Esto se conoce en la comunidad de Machine Learning como "Multi-Label Learning". Existen varios enfoques para el problema, incluidos los que describe en su pregunta. Algunos recursos para comenzar:
fuente
Cuando tiene dos variables con los mismos predictores, y la variable B también tiene la variable A como predictor, posiblemente esté buscando un problema de optimización, en el que desea optimizar las estimaciones de A y B simultáneamente. No tiene sentido optimizar uno, si obtiene una mala estimación para el segundo.
Este sería un problema de investigación de operaciones, y desafortunadamente fuera de mi ámbito de especialización.
fuente