Recientemente he usado la escala de Platt de salidas SVM para estimar las probabilidades de eventos predeterminados. Las alternativas más directas parecen ser la "Regresión logística del núcleo" (KLR) y la "Máquina de vectores de importación" relacionada.
¿Alguien puede decir qué método de kernel que da resultados de probabilidad es actualmente el estado del arte? ¿Existe una implementación R de KLR?
¡Muchas gracias por su ayuda!
logistic
svm
kernel-trick
RichardN
fuente
fuente
Respuestas:
La clasificación del proceso gaussiano (usando la propagación de expectativas) es probablemente el estado del arte en el aprendizaje automático. Hay un excelente libro de Rasmussen y Williams (descargable de forma gratuita), cuyo sitio web tiene una muy buena implementación de MATLAB. Más software, libros, documentos, etc. aquí . Sin embargo, en la práctica, KLR probablemente funcionará igual de bien para la mayoría de los problemas, la mayor dificultad es seleccionar el kernel y los parámetros de regularización, lo que probablemente se hace mejor mediante validación cruzada, aunque la validación cruzada de dejar uno fuera puede ser aproximada muy eficientemente, ver Cawley y Talbot (2008).
fuente
Supongo que sabes que el núcleo para la regresión logística no es paramétrico, así que antes que nada tienes esa restricción.
Con respecto al paquete R, el que conozco y funciona bastante bien es np : métodos de suavizado de kernel no paramétricos para tipos de datos mixtos
Este paquete proporciona una variedad de métodos de kernel no paramétricos (y semiparamétricos) que manejan sin problemas una combinación de tipos de datos de factores continuos, desordenados y ordenados.
Con respecto al kernel de última generación, puedo recomendar experimentar con los descritos en este documento de 2009. Léalo detenidamente para elegir el que sea mejor y más actual para usted.
fuente