Actualmente estoy leyendo y viendo algoritmos genéticos y me parece muy interesante (no he tenido la oportunidad de estudiarlo mientras estaba en la universidad).
Entiendo que las mutaciones se basan en la probabilidad (la aleatoriedad es la raíz de la evolución) pero no entiendo por qué es la supervivencia.
Por lo que entiendo, un individuo que una aptitud como para otra persona tiene una aptitud tenemos , entonces una mejor probabilidad que de sobrevivir a la próxima generación.
Probabilidad implica que puede sobrevivir y pueden no (con la "mala suerte"). No entiendo por qué esto es bueno en absoluto? Si gustaría siempre sobrevivir a la selección, lo que podría ir mal en el algoritmo? Supongo que el algoritmo sería similar a un algoritmo codicioso, pero no estoy seguro.
Respuestas:
La idea principal es que al permitir que los individuos subóptimos sobrevivan, puede cambiar de un "pico" en el paisaje evolutivo a otro a través de una secuencia de pequeñas mutaciones incrementales. Por otro lado, si solo puedes subir cuesta arriba, se requiere una mutación gigantesca y enormemente improbable para cambiar los picos.
Aquí hay un diagrama que muestra la diferencia:
Prácticamente, esta propiedad de globalización es el principal punto de venta de los algoritmos evolutivos: si solo desea encontrar un máximo local, existen técnicas especializadas más eficientes. (p. ej., L-BFGS con gradiente de diferencia finita y búsqueda de línea)
En el mundo real de la evolución biológica, permitir que los individuos subóptimos sobrevivan crea robustez cuando cambia el paisaje evolutivo. Si todos se concentran en un pico, entonces si ese pico se convierte en un valle, toda la población muere (por ejemplo, los dinosaurios fueron las especies más aptas hasta que hubo un ataque de asteroides y el paisaje evolutivo cambió). Por otro lado, si hay algo de diversidad en la población, cuando el paisaje cambie, algunos sobrevivirán.
fuente
La respuesta de Nick Alger es muy buena, pero voy a hacerlo un poco más matemático con un método de ejemplo, el método Metropolis-Hastings.
En otras palabras, si está más en forma, siempre lo tomamos, pero si está menos en forma, lo tomamos con probabilidad , de lo contrario lo intentamos nuevamente hasta que aceptemos un mutación.j F ( j )j j F(j)F(i)
Ahora nos gustaría explorar , la probabilidad real de que hagamos la transición de a .i jP(i,j) i j
Claramente es:
Supongamos que . Entonces = 1, y así:min ( 1 , F ( j )F(j)≥F(i) min(1,F(j)F(i))
Ejecutando el argumento al revés, y también examinando el caso trivial donde , puede ver eso para todos y :i=j i j
Esto es notable por algunas razones.
La probabilidad de transición es independiente de . Por supuesto, puede llevarnos un tiempo terminar en el atractor, y puede llevarnos un tiempo aceptar una mutación. Una vez que hagamos, la probabilidad de transición es totalmente dependiente de , y no en .Q F Q
Resumiendo todo lo que :i
Claramente, debe sumar si sumas todo (es decir, las probabilidades de transición de un estado deben sumar ), por lo que obtienes:P(j,i) 1 i 1
Es decir, es la función de densidad de probabilidad (no normalizada) para la cual el método elige. No solo tiene la garantía de explorar todo el paisaje, sino que lo hace en proporción a la "adecuación" de cada estado.F
Por supuesto, este es solo un ejemplo de muchos; Como señalé a continuación, es un método muy fácil de explicar. Por lo general, usa un GA no para explorar un pdf, sino para encontrar un extremo, y puede relajar algunas de las condiciones en ese caso y aún garantizar la convergencia eventual con alta probabilidad.
fuente
La ventaja de usar un GA es que puede explorar espacios de búsqueda más amplios siguiendo caminos que provienen de candidatos potencialmente peores. Debería haber peores candidatos para explorar estas diferentes áreas de la búsqueda, no muchas, pero definitivamente unas pocas. Si comienzas a tomar solo lo mejor cada vez que eliminas este aspecto de exploración del algoritmo y se convierte más en un escalador. Además, solo seleccionar lo mejor constantemente puede conducir a una convergencia prematura.
fuente
En realidad, los algoritmos de selección toman ambos enfoques. Una forma es lo que usted sugirió y la otra es que las personas con mayor condición física son seleccionadas y aquellas con niveles más bajos no.
El enfoque que elija para la selección también se adapta al problema que está tratando de modelar. En un experimento en la escuela, estábamos tratando de evolucionar a los jugadores de cartas haciéndolos jugar uno contra el otro (es decir , la selección de torneos ). En tal escenario, podríamos favorecer siempre a sobre (a partir de su ejemplo) porque el aspecto de 'suerte' ya está en el juego en sí. Incluso si para cualquiera de los dos y , en cualquier ronda, solo por la forma en que se repartieron las manos y cómo jugaron los demás, podría haber ganado la ronda y así podríamos terminar conI J F(i)>F(j) I J J F(j)>F(i) . Tenga en cuenta que una población suele ser lo suficientemente grande como para permitirse el lujo de perder algunas personas buenas y, en general, no importará tanto.
Dado que las AG se modelan en torno a la evolución del mundo real, cuando se utilizan distribuciones probabilísticas, se modelan principalmente en torno a cómo evolucionan las comunidades reales en las que a veces las personas con una condición física más baja pueden sobrevivir, mientras que las personas con una condición física más alta no (una analogía cruda: accidentes automovilísticos, natural desastres, etc. :-)).
fuente
es muy simple, desde un punto de vista: a veces, las soluciones de "niño" de mayor aptitud física pueden nacer de soluciones de "padre" de menor aptitud física a través de cruce o mutación (que en realidad es una gran parte de la teoría de los algoritmos genéticos). por lo tanto, en general, uno quiere buscar / llevar las soluciones de mayor aptitud física, pero demasiado énfasis en mantener / reproducir solo soluciones de alta aptitud física puede llevar a quedarse atascado en los mínimos locales y no buscar en el gran "paisaje evolutivo". en realidad, uno puede hacer que el "límite de aptitud física superior" para la supervivencia sea tan estricto o laxo como se desee y experimentar cómo afecta la calidad de la solución final. estrategias de corte demasiado estrictas o demasiado laxas conducirán a soluciones finales inferiores. Por supuesto, todo esto tiene alguna relación con la evolución biológica real. allí es más "
fuente