El problema de diseñar un clasificador de clases múltiples usando LDA puede expresarse como un problema de 2 clases (uno frente a todo lo demás) o un problema de clases múltiples .
¿Por qué es que, en ciertos casos , el clasificador LDA de múltiples clases supera el LDA de 2 clases (uno frente a todo lo demás) o viceversa .
Respuestas:
Creo que el clasificador LDA de múltiples clases siempre (bueno, en la mayoría de las tareas prácticas) supera el LDA de 2 clases. Y trataré de describir por qué.
Eche un vistazo al conjunto de datos de ejemplo:
Tienes tres clases aquí. Y supongamos que desea construir un clasificador uno contra otro con LDA para la clase azul.
La media estimada para la clase "azul" es cero, pero la media estimada para la clase "otro" también es cero. Y la covarianza es la misma de la definición de LDA. Eso significa que LDA responderá con la etiqueta que tiene más elementos. ¡Y nunca devolverá la clase "azul" en absoluto!
Para Multi-class LDA se las arreglará para encontrar las clases correctas perfectamente.
El trasfondo de esto es que la mezcla de gaussianos ya no es gaussiana en la mayoría de los casos. Entonces esta suposición de LDA falla. Y debo decir que es realmente difícil encontrar un ejemplo de un conjunto de datos en el que todas las clases sean gaussianas, y que sigan siendo gaussianas después de que nos unamos a ellas.
Es por eso que recomiendo utilizar LDA de clase múltiple. ¡Espero que ayude!
fuente