Dada una función desconocida , podemos evaluar su valor en cualquier punto de su dominio, pero no tenemos su expresión. En otras palabras, f es como una caja negra para nosotros.
¿Cuál es el nombre del problema de encontrar el minimizador de ? ¿Cuáles son algunos métodos por ahí?
¿Cuál es el nombre del problema de encontrar la solución a la ecuación ? ¿Cuáles son algunos métodos por ahí?
En los dos problemas anteriores, ¿es una buena idea interpolar o ajustar algunas evaluaciones de f: usando una función g θ con forma y parámetro conocidos θ por determinar, y luego minimizar g θ o encontrar su raíz?
¡Gracias y saludos!
optimization
Tim
fuente
fuente
Respuestas:
Los métodos que está buscando, es decir, que solo utilizan evaluaciones de funciones pero no derivados, se denominan métodos de optimización sin derivación . Existe una gran cantidad de literatura sobre ellos, y puede encontrar un capítulo sobre tales métodos en la mayoría de los libros sobre optimización. Los enfoques típicos incluyen
fuente
Creo que debería comenzar con: Taller de GECCO sobre Benchmarking de optimización de caja negra de parámetros reales (BBOB 2016) http://numbbo.github.io/workshops/index.html
Encontrará muchos algoritmos diferentes que se han utilizado en competiciones anteriores y que se han comparado de forma común. Si comienza en otro lugar, pronto se ahogará en los cientos de documentos que afirman que sus métodos y algoritmos funcionan mejor que otros con poca evidencia real de esas afirmaciones.
Hasta hace poco, era, para ser franco, una situación vergonzosa y todo el poder para INRIA, GECCO y muchos otros por el esfuerzo que han realizado para establecer un marco para las comparaciones racionales.
fuente
Solo agregaría que una de las claves aquí es poder escalar el método de optimización en CPU multinúcleo . Si puede realizar varias evaluaciones de funciones simultáneamente, le proporciona una aceleración igual a una cantidad de núcleos involucrados. Compare esto con solo usar un modelo de respuesta un poco más preciso, que lo hace un 10% más eficiente más o menos.
Recomiendo mirar este código , puede ser útil para las personas que tienen acceso a muchos núcleos. Una matemática detrás de esto se describe en este artículo .
fuente