Tengo dos preguntas relacionadas con el concepto de "consistencia de aprendizaje" para aquellos que están familiarizados con la teoría del aprendizaje estadístico a la Vapnik.
Pregunta 1.
El proceso de aprendizaje se llama consistente (para la clase de funciones y distribución de probabilidad ) Si
Estas dos condiciones son independientes. En P. 83 de la "Teoría del aprendizaje estadístico" de Vapnik hay un ejemplo de un conjunto de clasificadores tal manera que la segunda convergencia tiene lugar pero la primera no. Estaba pensando en un ejemplo de un conjunto de clasificadores de manera que la primera convergencia tenga lugar pero la segunda no, y no se me ocurrió nada. ¿Me puede ayudar alguien?
Pregunta 2.
El proceso de aprendizaje se llama no trivialmente consistente (o estrictamente consistente) (para la clase de funciones y distribución de probabilidad ) si para cualquier número real tal que establezca no está vacío, tenemos:
La página 81 de la "Teoría del aprendizaje estadístico" de Vapnik proporciona una ilustración de por qué queremos considerar la consistencia estricta en lugar de la consistencia definida en la Pregunta 1, es decir, por qué queremos presentar y considerar para cualquier . Todos los demás textos que consideran la consistencia estricta esencialmente duplican la ilustración de Vapnik cuando quieren explicar la razón detrás del concepto de consistencia estricta. Sin embargo, no estoy muy contento con la ilustración de Vapnik debido a 2 razones: primero, se hace en términos de funciones de pérdiday no los clasificadores, y, segundo, Fig. 3.2. del libro realmente no tiene sentido cuando consideramos la función de pérdida común para problemas de clasificación, es decir, la función que es igual a 0 cuando la etiqueta de clase pronosticada es igual a la etiqueta de clase verdadera y a 1 en caso contrario.
Entonces, ¿es posible dar otra ilustración más sensata del fundamento del concepto de consistencia estricta? Esencialmente, necesitamos un ejemplo de un conjunto de clasificadores de manera que estos clasificadores no sean consistentes (en términos de la definición de la Pregunta 1) y algún nuevo clasificador que funcione mejor que cualquiera de los clasificadores del conjunto, de modo que cuando agreguemos estos clasificadores al conjunto terminamos con el caso de "consistencia trivial". ¿Algunas ideas?
fuente