Investigando sobre el algoritmo xgboost, revisé la documentación .
En este enfoque, los árboles se regularizan utilizando la definición de complejidad donde y son parámetros, es el número de hojas terminales y es la puntuación en cada hoja.
Me pregunto: ¿cómo define esto la complejidad? , el número de nodos terminales, me parece natural. ¿Pero la suma de las puntuaciones finales al cuadrado?
Tal vez se pretende sobreajustar. ¿Significa que puntuaciones muy grandes dan demasiada confianza? ¿Se elige obtener un alumno débil? ¿Cuál es una explicación natural para esta elección de la función de complejidad?