¿Alguien puede decirme qué significa la frase 'estudiante débil'? ¿Se supone que es una hipótesis débil? Estoy confundido acerca de la relación entre un alumno débil y un clasificador débil. ¿Ambos son iguales o hay alguna diferencia?
En el algoritmo AdaBoost, T=10
. ¿Qué se entiende por eso? ¿Por qué seleccionamos T=10
?
classification
svm
terminology
adaboost
pac-learning
vrushali
fuente
fuente
Respuestas:
Un alumno 'débil' (clasificador, predictor, etc.) es solo uno que tiene un desempeño relativamente pobre: su precisión está por encima del azar, pero apenas. A menudo, pero no siempre, existe la implicación adicional de que es computacionalmente simple. El alumno débil también sugiere que muchas instancias del algoritmo se agrupan (a través de refuerzo, embolsado, etc.) para crear un clasificador de conjunto "fuerte".
Se menciona en el documento original AdaBoost de Freund & Schapire:
pero creo que la frase es en realidad más antigua que eso: he visto a personas citar un artículo final (?!) de Michael Kearns de la década de 1980.
El ejemplo clásico de un estudiante débil es un tocón de decisión, un árbol de decisión de un nivel (1R o OneR es otro estudiante débil de uso común; es bastante similar). Sería un tanto extraño llamar a un SVM un 'alumno débil', incluso en situaciones en las que tiene un desempeño deficiente, pero sería perfectamente razonable llamar a un aprendiz débil una decisión difícil, incluso cuando se desempeña sorprendentemente bien por sí mismo.
Adaboost es un algoritmo iterativo y generalmente denota el número de iteraciones o "rondas". El algoritmo comienza entrenando / probando a un alumno débil en los datos, ponderando cada ejemplo por igual. Los ejemplos que se clasifican erróneamente aumentan sus pesos para la (s) siguiente (s) ronda (s), mientras que aquellos que están clasificados correctamente obtienen sus pesos disminuidos.
No estoy seguro de que haya algo mágico en . En el artículo de 1995, se proporciona como un parámetro libre (es decir, lo configura usted mismo).T= 10 T
fuente
El alumno débil es un alumno que, sin importar cuál sea la distribución sobre los datos de entrenamiento, siempre será mejor que el azar, cuando intenta etiquetar los datos. Si lo hacemos mejor que el azar, siempre tendremos una tasa de error menor a 1/2.
Esto eventualmente mejora a los estudiantes débiles y los convierte en estudiantes fuertes.
Para más información: https://youtu.be/zUXJb1hdU0k .
fuente
El alumno débil es lo mismo que un clasificador débil o un predictor débil. La idea es que uses un clasificador que, bueno ... no sea tan bueno, pero al menos mejor que al azar. El beneficio es que el clasificador será robusto en el sobreajuste. Por supuesto, no usa solo uno, sino un gran conjunto de ellos, cada uno ligeramente mejor que al azar. La forma exacta en que los selecciona / combina depende de la metodología / algoritmo, por ejemplo, AdaBoost.
En la práctica, como clasificador débil, utiliza algo así como un umbral simple en una sola característica. Si la característica está por encima del umbral, predice que pertenece a los aspectos positivos; de lo contrario, decide que pertenece a los negativos. No estoy seguro acerca de T = 10, ya que no hay contexto, pero puedo suponer que es un ejemplo de umbral de alguna característica.
fuente