Recientemente me enteré de la conjetura codiciosa para el problema de la supercuerda más corta .
En este problema, se nos da un conjunto de cadenas queremos encontrar la súper cadena más corta, decir, cada aparece como una subcadena de .
Este problema es NP-hard y después de una larga secuencia de documentos, el algoritmo de aproximación más conocido para este problema tiene una relación [Paluch '14].
En la práctica, los biólogos usan el siguiente algoritmo de Greedy:
En cada paso, combine dos cadenas que tengan una superposición máxima sobre todos los pares (el sufijo máximo que es el prefijo de otra cadena) y repita en esta nueva instancia hasta que solo quede una cadena (que es una supercadena de todas las cadenas de entrada )
Se puede obtener un límite inferior de en la relación de aproximación de este Algoritmo codicioso a partir de la entrada .
Curiosamente, se conjeturó que este es el peor ejemplo, es decir, que Greedy logra una aproximación de para el problema de la supercuerda más corta. Me sorprendió mucho ver que un algoritmo tan natural y fácil es tan difícil de analizar.
¿Hay intuiciones, hechos, observaciones, ejemplos que sugieran por qué esta pregunta es tan desafiante?
fuente
Respuestas:
Permítanme primero intentar resumir lo que se sabe sobre la Conjetura codiciosa.
Creo que una de las razones por las que es difícil probar la conjetura codiciosa podría ser la siguiente. La mayoría de los enfoques para probar las garantías de aproximación del algoritmo codicioso analizan el gráfico de superposición (o, equivalentemente, el gráfico de prefijo) del conjunto de cadenas de entrada. Solo conocemos algunas propiedades de estos gráficos (como las desigualdades de Monge y Triple), pero estas propiedades probablemente no sean suficientes para probar la conjetura codiciosa ( Weinard, Schnitger ; Laube, Weinard ).
fuente