He leído el artículo de Alexandru Niculescu-Mizil y Rich Caruana " Obtención de probabilidades calibradas del aumento " y la discusión en este hilo. Sin embargo, todavía tengo problemas para comprender e implementar la logística o el escalado de Platt para calibrar la salida de mi clasificador de refuerzo de varias clases (refuerzo suave con tocones de decisión).
Estoy algo familiarizado con los modelos lineales generalizados, y creo que entiendo cómo funcionan los métodos logísticos y de calibración de Platt en el caso binario, pero no estoy seguro de saber cómo extender el método descrito en el documento al caso de clases múltiples.
El clasificador que estoy usando muestra lo siguiente:
- = Número de votos que el clasificador emite para la clase j para la muestra i que se está clasificando
- = clase estimada
En este punto tengo las siguientes preguntas:
P1: ¿Necesito usar un logit multinomial para estimar probabilidades? ¿o aún puedo hacer esto con regresión logística (p. ej. en una forma de 1 contra todos )?
P2: ¿Cómo debo definir las variables objetivo intermedias (por ejemplo, como en la escala de Platt) para el caso de múltiples clases?
P3: Entiendo que esto podría ser mucho pedir, pero ¿alguien estaría dispuesto a esbozar el pseudocódigo para este problema? (en un nivel más práctico, estoy interesado en una solución en Matlab).
fuente
Respuestas:
Este es un tema de interés práctico para mí también, así que investigué un poco. Aquí hay dos documentos de un autor que a menudo se enumeran como referencia en estos asuntos.
La esencia de la técnica recomendada aquí es reducir el problema multiclase a uno binario (por ejemplo, uno versus el resto, AKA uno versus todos), usar una técnica como Platt (preferiblemente usando un conjunto de pruebas) para claibrar las puntuaciones / probabilidades binarias y luego combine estos utilizando una técnica como se discutió en los documentos (uno es una extensión de un proceso de "acoplamiento" de Hastie et al.) En el primer enlace, los mejores resultados se encontraron simplemente normalizando las probabilidades binarias a las que suman 1.
Me encantaría escuchar otros consejos y si alguna de estas técnicas se ha incluido en R.
fuente