Preguntas etiquetadas con hessian

132

¿Por qué el método de Newton no se usa ampliamente en el aprendizaje automático?

Esto es algo que me ha estado molestando por un tiempo, y no pude encontrar ninguna respuesta satisfactoria en línea, así que aquí va: Después de revisar un conjunto de conferencias sobre optimización convexa, el método de Newton parece ser un algoritmo muy superior al descenso de gradiente para...

29

¿Por qué no usar la tercera derivada para la optimización numérica?

Si los hessianos son tan buenos para la optimización (ver, por ejemplo, el método de Newton ), ¿por qué detenerse allí? ¿Vamos a usar las derivadas tercera, cuarta, quinta y sexta? Por qué

optimization gradient-descent hessian

23

Explicación de min_child_weight en el algoritmo xgboost

La definición del parámetro min_child_weight en xgboost se da como: suma mínima de peso de instancia (hessian) necesaria en un niño. Si el paso de partición del árbol da como resultado un nodo hoja con una suma de peso de instancia menor que min_child_weight, entonces el proceso de construcción...

machine-learning xgboost hessian